Data for thai ner.
นี้เป็น GitHub สำหรับสร้างข้อมูลสำหรับใช้ Train NER ภาษาไทย
- ให้กด fork แล้วทำการเพิ่มการ tag ลงไปในโฟลเดอร์ data
- การ tag โดยจะนับบรรทัดละ 1 ประโยคเท่านั้น
- การ tag ให้ใช้ [tag] แล้วปิดด้วย [/tag] เสมอ
- คำอื่น ๆ ที่ไม่ได้ tag ให้ใส่ใน [word]ทุกคำ รวมถึงเครื่องหมาย ช่องว่างหรืออื่น ๆ ที่ไม่ได้ถูก tag[/word]
- ให้ใช้ tag ตามที่กำหนดใน tag.md หากต้องการ tag เพิ่มเติม ให้ทำการเพิ่ม tag พร้อมรายละเอียดลงในไฟล์ tag.md ด้วย
- สามารถสร้างไฟล์ใหม่สำหรับใช้ tag ได้
- เมื่อทำการ tag สำเร็จแล้วให้กด pull requests ส่งมายัง GitHub อันนี้
ขอบคุณทุกท่านที่ร่วมพัฒนาคลังข้อมูลนี้
นาย วรรณพงษ์ ภัททิยไพบูลย์
นักพัฒนา PyThaiNLP
นักศึกษา สาขาวิทยาการคอมพิวเตอร์และสารสนเทศ คณะวิทยาศาสตร์ประยุกต์และวิศวกรรมศาสตร์
มหาวิทยาลัยขอนแก่น วิทยาเขตหนองคาย