Friday, June 5, 2009

เริ่มงาน BIOTEC อีกแล้ว ^^"

03/06/09

เข้าแลปตอนบ่าย ... วันนี้แน่นอนว่าน่าจะได้แก้งานที่ BIOTEC ร่วมกับพี่เจน หลังจากที่เมื่อวานคุยกันไปบ้างนิดหน่อย แต่ยังไม่ได้เริ่มทำงานจริงจัง

เข้ามาว่าจะคุยกับพี่เจนทาง msn ก็พบอยู่แล้วว่า เจ้าตัวกำลังรออยู่เลย ... ขึ้นหัว msn ซะชัดเจน

"แซมมี่มาแล้วทักด้วย"

โอว ... แม่เจ้า ... การตามคนแบบนี้ก็มีด้วยแฮะ ... เฮือกกกก!!! ... ก็เลยรีบตอบกลับไปด้วยอาการเป็นห่วงงานหน่อยๆ ... แต่ว่าแต่ว่า ... ทำไมไม่ทิ้ง offline message ไว้หว่า ... มันก็มาถึงเหมือนกันนี่ ... เง้ออออ

งานในช่วงสำคัญของอาทิตย์นี้ก็เป็นการ generate ข้อมูลของ cassava ให้เป็นข้อมูล gff เพื่อนำไปแสดงผลบน GBrowse น่ะครับ

GBrowse คืออะไร?

GBrowse หรือ Generic Genome Browse เป็นเครื่องมือบนเว็บสำหรับแสดงผลข้อมูล annotation ของงานทาง Bioinformatics โดยข้อมูลที่จะนำมาแสดงผลนั้นจะต้องอยู่ในรูปแบบที่ GBrowse นำมาแสดงได้ เช่น GFF files, หรือ chado db << เจ้า chado db เนี่ย ... ศึกษายังไงผมก็ไม่รู้เรื่อง ก็เลยใช้ GFF แหละง่ายดี แง่มๆ การจะใช้ GBrowse นอกจากจะมีไฟล์ข้อมูลที่จะเก็บในรูปแบบไฟล์ (GFF) หรือฐานข้อมูล (GFF db or chado db or ncbi db or etc.) จะต้องใช้คู่กับ Configuration file เพื่อระบุชัดย่อยลงไปอีกว่า แต่ละส่วนประกอบสำคัญนั้น ต้องการให้แสดงผลอย่างไร ... ตรงนี้แหละ สนุกที่สุด :P GFF File คืออะไร?

GFF หรือ General Feature Format เป็นรูปแบบที่ใช้อธิบาย genes และ features อื่นๆ ที่มีการเชื่อมโยงกับ DNA, RNA และ Protein sequences โดยเอกสาร GFF จะประกอบด้วยข้อมูลที่บอกรายละเอียดพื้นฐานในแต่ละแถว เรียกว่า NSE (name, start, end) เพื่อระบุถึงหน่วยย่อยของ biological sequence เช่น NSE (Chromosome1, 2000, 3000) ระบุข้อมูล third kilobase ของ sequence ชื่อว่า Chromosome1 เป็นต้น

อันนี้เป็นตัวอย่างไฟล์ GFF นะครับ

ctgA example Contig 1 50000 . . . Contig ctgA
ctgA example my_feature 1659 1984 . + . My_feature f07
ctgA example my_feature 3014 6130 . + . My_feature f06
ctgA example my_feature 4715 5968 . - . My_feature f05
ctgA example my_feature 13280 16394 . + . My_feature f08
...
จะเห็นว่ามันมีทั้งหมด 9 column ส่วนไอ้ที่มีปัญหาที่สุดก็เจ้า column ที่ 9 นี่แหละครับ T_T ...

สรุป ... งาน BIOTEC วันนี้ที่ทำก็เป็นการดูแลความถูกต้องของไฟล์ที่พี่เจนได้ generate มาส่วนหนึ่ง เพื่อนำบางส่วนมาเขียน config แล้วนำไปทดสอบ อีกทั้งเป็นที่ปรึกษาการเรียงข้อมูลทั้ง 9 column (เอ๊ะ ... ดูเราสำคัญยังไงอยู่นะเนี่ย ... อิอิ)

No comments:

Post a Comment

ZAMACHITA - I AM ZAM