วันจันทร์ที่ 16 ธันวาคม พ.ศ. 2556

คำศัพท์ ครั้งที่ 5 วิชา AS for B

1. Information retrieval (IR) คือ ระบบการค้นคืนสารสนเทศ ที่มีความสัมพันธ์(Relevance)กับคำค้น(query)ที่ผู้ใช้ใส่เข้าไปในระบบ เน้นว่า ”เอกสารหรือสารสนเทศที่ถูกค้นคืนจะต้อง relevant กับคำค้นในเชิงตัวหนังสือ(text)”

2. Entity Search เป็นการ search หาตัวแทนที่มีคุณสมบัติหรือคุณลักษณะเหมือน/คล้ายคำค้น (Entity คือตัวแทนที่รู้จักโดยทั่วไปเช่นพนักงาน, นักเรียน, บริษัท ) เช่นใช้คำค้นว่า “biomedical research and technology” ผลลัพธ์การค้นคืนก็จะออกมาเป็น ชื่อองค์กรหรือห้องแล็บด้าน biomedical

3. Recall คือ สัดส่วนของ relevant document ที่ถูกค้นคืนออกมาได้ ต่อ relevant document ทั้งหมด ใน search engine เราไม่รู้ว่า relevant document มีอยู่เท่าไร

4. Precision คือ ความแม่นยำของเอกสารที่ถูกค้นคืนออกมาว่าถูกใจผู้ใช้แค่ไหน ใน search engineส่วนนี้ต้องให้คนมาประเมิน

5. False Positive (Type I Error)  เป็นความผิดพลาดที่ไม่ร้ายแรง ไม่จำเป็นต้องแก้ไขก็ได้

6. Mean Average Precision (MAP) เป็นค่าเฉลี่ยของ precision ของคำค้นหลายๆคำที่เกี่ยวข้องกัน(relevance) เอาไปทำ ranking

7. Interpolation เป็นการเฉลี่ยกราฟ precision-recallโดยการกำหนดค่าใหม่ให้ precision ซึ่งค่าสูงสุดของ precision จะเท่ากับค่าสูงสุดของ recall ในแต่ละระดับ

8. Tag Clouds คือ กลุ่ม tag ที่มีขนาดเล็กใหญ่ไม่เท่ากัน ถ้ามีการใช้บ่อยๆใช้มาก ก็จะตัวใหญ่

9. Collaborative Search เป็นการ search แบบช่วยกันเป็นทีมเป็นกลุ่มซึ่งต่างคนต่าง search ต่างก็ใช้คำค้นของตัวเอง แต่สนใจในงานแบบเดียวกัน

10. Bag of Words คือ เอกสารที่ไม่ได้สนใจเรื่องลำดับก่อนหลังของหรือความสัมพันธ์ของคำ(word) เปรียบเสมือนถุงที่บรรจุคำพอเทคำออกมาก็กระจัดกระจายอ่านไม่รู้ความ


ไม่มีความคิดเห็น:

แสดงความคิดเห็น