Monday, May 25, 2009

เขียนโปรแกรมใหม่อีกครั้ง

23/05/09 (เที่ยงคืนกว่าๆ)

หลังจากที่ได้กู้เครื่อง notebook มาเรียบร้อยแล้ว ก็มานั่งลงโปรแกรมที่ต้องใช้ใหม่อีกรอบ T_T ... ระหว่างลงโปรแกรม ก็มานั่งแก้ config ของ GBrowse ให้ทาง BIOTEC ซึ่งแก้เท่าที่ทำได้ ในส่วนของ category ใน track section นั้น ผมยังแก้ไม่ได้ครับ

พอลงโปรแกรมเท่าที่ใช้เสร็จ ก็กลับมาเริ่มเขียนโปรแกรมของงานที่ญี่ปุ่นใหม่อีกรอบครับ ... เพราะครั้งที่แล้ว ผมไม่ได้ parser เอาข้อมูลใน title ลงฐานข้อมูล ... มารอบนี้ผมก็เลยต้องเขียนโปรแกรมใหม่อีกครั้งครับ

คราวนี้ ออกแบบโปรแกรมให้ Main สามารถใส่ option ไว้รันได้ ... ไม่งั้นแก้ code เหนื่อยแย่เลย ... เหอะๆ แล้วก็สร้างฐานข้อมูลใหม่เป็น paj3 ครับ ... คราวนี้ใช้ข้อมูลงานวิจัยด้วยเลยครับ งานวิจัยที่ใช้ก็เป็นงานของ ICL ดังนี้ครับ

Tag ที่ควรจะ process มีดังนี้
- B110 <-- document id (unique id)
- B511 <-- First IPC code
- B512 <-- Second IPC codes
- B542 <-- Title
- SEC <-- Section tag

ผมเลยสร้าง table paj แล้วก็เพิ่ม field: id, filepath เข้าไปอีกหน่อย เพื่อเก็บ paj files ทั้งหมดครับ

จากนั้นก็เขียน Main3.java เพิ่ม option เข้าไปหน่อย แล้วก็เขียน PAJParser สำหรับ parser paj file โดยมี methods สำคัญๆ ดังนี้ครับ

- String getDocumentID() <-- B110
- String getFirstIPC() <-- B511
- Vector getSecondIPCs() <-- B512
- String getTitle() <-- B542
- String getSection() <-- SEC
- String getFilePath()
- private String transformIPC(String IPC) <-- แปลง IPC จาก B05B 17/06 เป็น B05B_17_06

เขียนโปรแกรมไฟล์นี้เสร็จก็ปาไปเช้าครับ ... จากนั้นก็กลับห้องไปอาบน้ำ เพราะเช้านี้มีแข่งซอฟต์บอลครับ ^^" ยังไม่นอน ... เหอะๆ

No comments:

Post a Comment

ZAMACHITA - I AM ZAM