เพจกึ่งป้องกัน

วิกิพจนานุกรม

จาก Wikipedia สารานุกรมเสรี
ข้ามไปที่การนำทาง ข้ามไปที่การค้นหา

วิกิพจนานุกรม
WiktionaryEn - DP Derivative.svg
โลโก้วิกิพจนานุกรมภาษาอังกฤษ
ภาพหน้าจอ
หน้าหลักวิกิพจนานุกรมภาษาอังกฤษ. png
หน้าหลักของวิกิพจนานุกรมภาษาอังกฤษวันที่ 14 มกราคม 2019
ประเภทของไซต์
พจนานุกรมออนไลน์
มีจำหน่ายในหลายภาษา (158 ใช้งานอยู่) [1]
เจ้าของมูลนิธิวิกิมีเดีย
สร้างโดยJimmy WalesและชุมชนWikimedia
URLวิกิพจนานุกรม. org
เชิงพาณิชย์ไม่
การลงทะเบียนไม่จำเป็น
เปิดตัว12 ธันวาคม 2545 ; 18 ปีที่แล้ว ( พ.ศ. 2545-12-12 )
สถานะปัจจุบันคล่องแคล่ว

วิกิพีเดียเป็นพูดได้หลายภาษาเว็บโครงการชั่นในการสร้างเนื้อหาฟรี พจนานุกรมของข้อตกลง (รวมถึงคำ , วลี , สุภาษิต , ไทปันภาษาศาสตร์ฯลฯ ) ในทุกภาษาธรรมชาติและในจำนวนของภาษาเทียมรายการเหล่านี้อาจมีคำจำกัดความ , ภาพภาพประกอบ, ออกเสียง , etymologies , โทน , ตัวอย่างการใช้งาน, ใบเสนอราคา , คำที่เกี่ยวข้องและการแปลของคำในภาษาอื่น ๆ รวมถึงคุณสมบัติอื่น ๆ มันเป็นเรื่องที่แก้ไขร่วมกันผ่านทางวิกิพีเดียใช้ชื่อเป็นกระเป๋าหิ้วของคำวิกิพีเดียและพจนานุกรมมันมีอยู่ใน 171 ภาษาและในภาษาอังกฤษง่ายๆเช่นเดียวกับโครงการในเครือWikipedia Wiktionary ดำเนินการโดยมูลนิธิ Wikimediaและเขียนโดยอาสาสมัครร่วมกันขนานนามว่า "Wiktionarians" ใช้ซอฟต์แวร์วิกิพีเดีย , มีเดียวิกิช่วยให้เกือบทุกคนสามารถเข้าถึงเว็บไซต์ที่จะสร้างและแก้ไขรายการ

เพราะวิกิพีเดียไม่ จำกัด โดยการพิจารณาพื้นที่การพิมพ์มากที่สุดของพจนานุกรมฉบับภาษาให้คำจำกัดความและคำแปลของคำจากหลายภาษาและบางรุ่นมีข้อมูลเพิ่มเติมมักจะพบในthesauri

ข้อมูลวิกิมักจะถูกใช้ในหลายงานการประมวลผลภาษาธรรมชาติ

ประวัติศาสตร์และพัฒนาการ

มีการเผยแพร่วิกิพจนานุกรมทางออนไลน์เมื่อวันที่ 12 ธันวาคม พ.ศ. 2545 [2]ตามข้อเสนอของแดเนียลอัลสตันและแนวคิดของแลร์รีแซงเจอร์ผู้ร่วมก่อตั้งวิกิพีเดีย [3]ที่ 28 มีนาคม 2004 เป็นครั้งแรกที่ไม่ใช่ภาษาอังกฤษ Wiktionaries ถูกริเริ่มขึ้นในฝรั่งเศสและโปแลนด์ วิกิพจนานุกรมในภาษาอื่น ๆ ได้เริ่มต้นขึ้นมากมาย Wiktionary ถูกโฮสต์บนชื่อโดเมนชั่วคราว(wiktionary.wikipedia.org) จนถึงวันที่ 1 พฤษภาคม 2004 เมื่อเปลี่ยนเป็นชื่อโดเมนปัจจุบัน [a]ณ เดือนพฤศจิกายน 2016 Wiktionary มีรายการมากกว่า 25.9 ล้านรายการในทุกฉบับ [4]ฉบับภาษาที่ใหญ่ที่สุดคือวิกิพจนานุกรมภาษาอังกฤษซึ่งมีรายการมากกว่า 6.6 ล้านรายการตามด้วยวิกิพจนานุกรมภาษาฝรั่งเศสที่มีมากกว่า 4.1 ล้านรายการและวิกิพจนานุกรมภาษามาลากาซีที่มีมากกว่า 1.6 ล้านรายการ สี่สิบสี่รุ่นของภาษาวิกิพจนานุกรมมีรายการมากกว่า 100,000 รายการในแต่ละฉบับ [b]

การใช้บ็อตเพื่อสร้างบทความจำนวนมากสามารถมองเห็นได้ในลักษณะ "การเพิ่มขึ้นอย่างรวดเร็ว" ในกราฟของบทความนี้จะนับรวมในวิกิพจนานุกรมที่ใหญ่ที่สุดแปดฉบับ (ข้อมูล ณ เดือนธันวาคม 2552 )

รายการส่วนใหญ่และคำจำกัดความจำนวนมากในรุ่นภาษาที่ใหญ่ที่สุดของโครงการสร้างขึ้นโดยบอทที่พบวิธีสร้างสรรค์ในการสร้างรายการหรือ (ไม่ค่อย) นำเข้าโดยอัตโนมัติหลายพันรายการจากพจนานุกรมที่เผยแพร่ก่อนหน้านี้ บอทเจ็ดใน 18 ตัวที่ลงทะเบียนในวิกิพจนานุกรมภาษาอังกฤษ[c]สร้าง 163,000 รายการที่นั่น[5]

บอทอีกตัวหนึ่ง "ThirdPersBot" เป็นผู้รับผิดชอบในการเพิ่มการผันคำกริยาของบุคคลที่สาม จำนวนมากซึ่งจะไม่ได้รับรายการของตัวเองในพจนานุกรมมาตรฐาน ตัวอย่างเช่นมันกำหนด "smoulders" เป็น "รูปแบบปัจจุบันที่เรียบง่ายเอกพจน์ของบุคคลที่สาม" จากคำจำกัดความ 648,970 คำวิกิพจนานุกรมภาษาอังกฤษให้คำศัพท์ภาษาอังกฤษ 501,171 คำ 217,850 เป็นคำจำกัดความประเภทนี้[6]ซึ่งหมายความว่าการครอบคลุมของภาษาอังกฤษมีขนาดเล็กกว่าพจนานุกรมการพิมพ์คำเดียวที่สำคัญเล็กน้อยOxford อังกฤษ , ตัวอย่างเช่นมี 615,000 headwords ขณะMerriam-Webster พจนานุกรมระหว่างประเทศที่สามใหม่ของภาษาอังกฤษ, ครบถ้วนมี 475,000 รายการ (พร้อมคำหลักที่ฝังไว้เพิ่มเติมมากมาย) มีสถิติโดยละเอียดเพื่อแสดงจำนวนรายการประเภทต่างๆที่มีอยู่

วิกิพจนานุกรมภาษาอังกฤษไม่ได้ใช้บอทเท่าที่มีบางฉบับทำฝรั่งเศสและเวียดนาม Wiktionaries ตัวอย่างเช่นที่นำเข้าส่วนใหญ่มาจากเวียดนามพจนานุกรมโครงการฟรี (FVDP) ซึ่งให้บริการฟรีพจนานุกรมสองภาษาเนื้อหาไปและกลับจากเวียดนาม[d]รายการที่นำเข้าเหล่านี้ประกอบขึ้นเป็นเนื้อหาของฉบับภาษาเวียดนามเกือบทั้งหมด รายการที่ไม่ใช่ภาษามาลากาซีเกือบทั้งหมดของวิกิพจนานุกรมภาษามาลากาซีถูกคัดลอกโดยบอทจากวิกิพจนานุกรมอื่น ๆ เช่นเดียวกับฉบับภาษาอังกฤษวิกิพจนานุกรมภาษาฝรั่งเศสได้นำเข้ารายการประมาณ 20,000 รายการจากฐานข้อมูลUnihan ที่มีอักขระภาษาจีนญี่ปุ่นและเกาหลี. วิกิพจนานุกรมภาษาฝรั่งเศสเติบโตขึ้นอย่างรวดเร็วในปี 2549 ขอบคุณส่วนใหญ่ที่บอทคัดลอกรายการจำนวนมากจากพจนานุกรมเก่าที่ได้รับอนุญาตอย่างเสรีเช่นDictionnaire de l'Académiefrançaiseฉบับที่ 8 (พ.ศ. 2478 ประมาณ 35,000 คำ) และใช้บอทเพื่อเพิ่ม คำจากวิกิพจนานุกรมฉบับอื่นที่มีคำแปลเป็นภาษาฝรั่งเศส รัสเซียฉบับเพิ่มขึ้นเกือบ 80,000 รายการเป็น "LXbot" รายการเพิ่มสำเร็จรูป (มีหัว แต่ไม่มีคำจำกัดความ) คำในภาษาอังกฤษและภาษาเยอรมัน [7]

ณ เดือนธันวาคม 2019 en.wiktionary มีคำจำกัดความเงามากกว่า 700,000 คำและคำจำกัดความทั้งหมดกว่า 1,100,000 รายการ (รวมถึงรูปแบบที่แตกต่างกัน) สำหรับรายการภาษาอังกฤษเพียงอย่างเดียวโดยมีรายการมากกว่า 6,100,000 รายการในทุกภาษา [8]

โลโก้

ในอดีต Wiktionary ไม่มีโลโก้ที่เหมือนกันในหลาย ๆ ภาษา บางฉบับใช้โลโก้ที่แสดงรายการพจนานุกรมเกี่ยวกับคำว่า "Wiktionary" ตามโลโก้ Wiktionary ภาษาอังกฤษก่อนหน้านี้ซึ่งออกแบบโดย Brion Vibber นักพัฒนาMediaWiki [9]เนื่องจากโลโก้ที่เป็นข้อความล้วนต้องแตกต่างกันอย่างมากในแต่ละภาษาการประกวดสี่ขั้นตอนเพื่อใช้โลโก้เครื่องแบบจึงจัดขึ้นที่ Wikimedia Meta-Wiki ตั้งแต่เดือนกันยายนถึงตุลาคม 2549 [e]บางชุมชนได้รับรางวัลชนะเลิศจาก "Smurrayinchester" ซึ่งเป็นกระเบื้องไม้ขนาด 3 × 3 ซึ่งแต่ละแห่งมีลักษณะจากระบบการเขียนที่แตกต่างกัน อย่างไรก็ตามการสำรวจความคิดเห็นไม่เห็นการมีส่วนร่วมจากชุมชน Wiktionary มากเท่าที่สมาชิกชุมชนบางคนคาดหวังไว้และในที่สุดวิกิจำนวนมากก็ยังคงรักษาโลโก้ที่เป็นข้อความไว้[e]

ในเดือนเมษายน 2552 ปัญหาได้รับการรื้อฟื้นด้วยการแข่งขันใหม่ คราวนี้การพรรณนาโดย "AAEngelman" ของพจนานุกรมแบบเปิดได้รับการโหวตแบบตัวต่อตัวกับโลโก้ปี 2006 แต่กระบวนการปรับแต่งและนำโลโก้ใหม่มาใช้นั้นก็หยุดลง[10]ในปีต่อ ๆ มาวิกิบางคนได้เปลี่ยนโลโก้ที่เป็นข้อความของตนด้วยโลโก้ใหม่กว่าหนึ่งในสองแบบ ในปี 2012 วิกิ 55 ตัวที่ใช้โลโก้วิกิพจนานุกรมภาษาอังกฤษได้รับการออกแบบในปี 2006 โดย "Smurrayinchester" ในเวอร์ชันแปล[f]ในเดือนกรกฎาคม 2016 วิกิพจนานุกรมภาษาอังกฤษได้นำโลโก้นี้ไปใช้ในรูปแบบต่างๆ[11]ณ วันที่ 4 กรกฎาคม 2559, 135 วิกิคิดเป็น 61% ของรายการของวิกิพจนานุกรมใช้โลโก้จากการออกแบบปี 2006 โดย "Smurrayinchester", 33 วิกิ (36%) ใช้โลโก้ที่เป็นข้อความและสามวิกิ (3%) ใช้การออกแบบปี 2009 โดย "AAEngelman" . [12]

เกณฑ์การรับรองความถูกต้อง

เพื่อความถูกต้อง, อังกฤษวิกิพีเดียมีนโยบายที่กำหนดว่าคำได้รับการพิสูจน์ [13]ข้อกำหนดในภาษาหลักเช่นอังกฤษและจีนต้องได้รับการยืนยันโดย:

  1. การใช้อย่างแพร่หลายอย่างชัดเจนหรือ
  2. ใช้ในสื่อบันทึกถาวรสื่อความหมายในกรณีอิสระอย่างน้อยสามกรณีซึ่งมีระยะเวลาอย่างน้อยหนึ่งปี

สำหรับภาษาที่มีเอกสารน้อยเช่นภาษาครีกและภาษาที่สูญพันธุ์ไปแล้วเช่นภาษาลาตินการใช้ภาษาเดียวในสื่อบันทึกถาวรหรือการกล่าวถึงอย่างหนึ่งในงานอ้างอิงเป็นการยืนยันที่เพียงพอ

หลายภาษา

ในเดือนพฤษภาคม 2021 มีเว็บไซต์ Wiktionary 182 ภาษาซึ่ง 158 ภาษาเปิดใช้งานและ 24 แห่งถูกปิด [1]ไซต์ที่ใช้งานมี 29,931,257 บทความและไซต์ที่ปิดมี 339 บทความ [14]มีผู้ใช้ที่ลงทะเบียน 6,267,549 คนซึ่ง 5,520 คนมีการใช้งานเมื่อเร็ว ๆ นี้ [14]

โครงการภาษาวิกิพจนานุกรมสิบอันดับแรกตามจำนวนบทความของ mainspace: [14]

ภาษา วิกิ ดี รวม การแก้ไข แอดมิน ผู้ใช้ ผู้ใช้ที่ใช้งานอยู่ ไฟล์
1 ภาษาอังกฤษ en 6,645,248 7,475,401 62,460,388 104 3,819,765 1,817 24
2 ฝรั่งเศส fr 4,161,552 4,477,222 29,420,340 37 305,456 483 6
3 มาลากาซี มก 1,638,165 1,726,798 29,035,697 2 9,500 15 3
4 รัสเซีย รู 1,123,341 2,366,671 11,831,548 13 259,157 241 333
5 เยอรมัน เดอ 976,055 1,136,869 8,535,600 17 198,982 225 95
6 ชาวจีน zh 971,545 1,483,373 6,061,964 7 95,520 89 36
7 เซอร์โบ - โครเอเชีย 911,567 916,408 1,469,258 4 6,156 15 3
8 สเปน es 906,691 960,557 4,996,917 8 129,030 111 14
9 กรีก เอล 799,260 836,695 5,017,784 7 45,774 88 58
10 สวีเดน sv 794,597 835,159 3,504,881 14 48,097 76 1

สำหรับรายการทั้งหมดที่มีผลรวมโปรดดูสถิติของ Wikimedia: [15]

การรับที่สำคัญ

การรับวิกิพจนานุกรมอย่างมีวิจารณญาณได้รับการผสมผสาน ในปี 2006 Jill Lepore เขียนในบทความเรื่อง Noah's Ark เรื่องThe New Yorker , [g]

มีการแสดงของมือที่ไม่ได้วิกิพีเดีย ไม่มีแม้แต่กองบรรณาธิการ "เป็นผู้เขียนศัพท์ของคุณเอง!" อาจเป็นคติประจำใจของวิกิพจนานุกรม ใครต้องการผู้เชี่ยวชาญ ทำไมต้องจ่ายเงินที่ดีสำหรับพจนานุกรมที่เขียนโดยนักแปลศัพท์ในเมื่อเราสามารถรวบรวมพจนานุกรมได้ด้วยตัวเอง?

วิกิพจนานุกรมไม่ได้เป็นสาธารณรัฐหรือประชาธิปไตยมากเท่าลัทธิเหมา และดีพอ ๆ กับหนังสือที่หมดอายุลิขสิทธิ์ซึ่งขโมยมาเท่านั้น

บทวิจารณ์ของKeir GraffสำหรับBooklistมีความสำคัญน้อยกว่า:

มีที่สำหรับวิกิพจนานุกรมหรือไม่? ไม่ต้องสงสัย. อุตสาหกรรมและความกระตือรือร้นของผู้สร้างจำนวนมากเป็นเครื่องพิสูจน์ว่ามีตลาด และเป็นเรื่องที่ยอดเยี่ยมที่มีแหล่งข้อมูลที่แข็งแกร่งอีกแหล่งหนึ่งเพื่อใช้เมื่อค้นหาคำศัพท์แปลก ๆ ที่ปรากฏขึ้นในโลกที่เปลี่ยนแปลงอย่างรวดเร็วในปัจจุบันและสภาพแวดล้อมออนไลน์ แต่เช่นเดียวกับแหล่งที่มาของเว็บจำนวนมาก (รวมถึงคอลัมน์นี้) ผู้ใช้ที่มีความซับซ้อนจะใช้ร่วมกับแหล่งข้อมูลที่มีชื่อเสียงมากกว่า[ ต้องการอ้างอิง ]

การอ้างอิงในสิ่งพิมพ์อื่นหายวับไปและเป็นส่วนหนึ่งของการอภิปรายใหญ่ ๆ ของ Wikipedia ซึ่งไม่ก้าวหน้าไปกว่าคำจำกัดความแม้ว่า David Brooks ในThe Nashua Telegraphจะอธิบายว่า "ป่าเถื่อนและขนปุย" [17]อุปสรรคอย่างหนึ่งในการรายงานข่าวที่เป็นอิสระของ Wiktionary คือความสับสนที่เกิดขึ้นอย่างต่อเนื่องซึ่งเป็นเพียงส่วนขยายของ Wikipedia [h] ในปี 2548 นิตยสารพีซีได้จัดอันดับให้ Wiktionary เป็นหนึ่งใน "เว็บไซต์ 101 อันดับแรก" ของอินเทอร์เน็ต[18]แม้ว่าจะได้รับข้อมูลเพียงเล็กน้อยเกี่ยวกับไซต์ก็ตาม

การวัดความถูกต้องของการผันคำศัพท์ภาษาโปแลนด์บางคำในวิกิพจนานุกรมภาษาอังกฤษแสดงให้เห็นว่าข้อมูลทางไวยากรณ์นี้มีความเสถียรมาก มีคำในภาษาโปแลนด์เพียง 131 คำจาก 4,748 คำเท่านั้นที่ได้รับการแก้ไขข้อมูลการผันคำ [19]

ข้อมูลวิกิพจนานุกรมในการประมวลผลภาษาธรรมชาติ

วิกิพีเดียมีข้อมูลกึ่งโครงสร้าง [20]ข้อมูลพจนานุกรมวิกิพจนานุกรมสามารถแปลงเป็นรูปแบบที่เครื่องอ่านได้เพื่อใช้ในงานประมวลผลภาษาธรรมชาติ [21] [22] [23]

การขุดข้อมูลในวิกิพจนานุกรมเป็นงานที่ซับซ้อน มีปัญหาดังต่อไปนี้: [24]

    • (1) การเปลี่ยนแปลงข้อมูลและสคีมาตาอย่างต่อเนื่องและบ่อยครั้ง
    • (2) ความแตกต่างใน schemata ฉบับภาษาวิกิพจนานุกรม[i]และ
    • (3) ธรรมชาติของมนุษย์เป็นศูนย์กลางของวิกิพีเดีย

มีตัวแยกวิเคราะห์หลายตัวสำหรับรุ่นภาษาวิกิพจนานุกรมที่แตกต่างกัน: [25]

  • วิกิพจนานุกรม DBpedia: [26]โครงการย่อยของDBpediaข้อมูลที่ดึงมาจากวิกิพจนานุกรมอังกฤษฝรั่งเศสเยอรมันและรัสเซีย ข้อมูลประกอบด้วยภาษาส่วนของคำพูดคำจำกัดความความสัมพันธ์เชิงความหมายและการแปล คำอธิบายที่เปิดเผยของสคีมาหน้า[27] นิพจน์ทั่วไป[28]และตัวแปลงสัญญาณสถานะ จำกัด[29]ถูกนำมาใช้เพื่อดึงข้อมูล
  • JWKTL (Java วิกิห้องสมุด): [30]ให้การเข้าถึงภาษาอังกฤษและภาษาเยอรมันวิกิพจนานุกรมทิ้งผ่านทาง Java วิกิ API [31]ข้อมูลประกอบด้วยภาษาส่วนของคำพูดคำจำกัดความคำพูดความสัมพันธ์เชิงความหมายนิรุกติศาสตร์และการแปล JWKTL การกระจายภายใต้สัญญาอนุญาต Apache
  • wikokit: [32]ตัวแยกวิเคราะห์ของวิกิพจนานุกรมภาษาอังกฤษและวิกิพจนานุกรมภาษารัสเซีย [33]ข้อมูลที่แยกวิเคราะห์ ได้แก่ ภาษาส่วนของคำพูดคำจำกัดความคำพูด[34] [ญ]ความสัมพันธ์ทางความหมาย[35]และการแปล นี่คือซอฟต์แวร์โอเพนซอร์สที่ได้รับอนุญาตหลายใบ
  • รายการนิรุกติศาสตร์ได้รับการแยกวิเคราะห์ในนิรุกติศาสตร์WordNetโครงการ [36]

ตัวอย่างของงานประมวลผลภาษาธรรมชาติซึ่งได้รับการแก้ไขด้วยความช่วยเหลือของข้อมูล Wiktionary ได้แก่ :

  • ตามกฎเครื่องแปลภาษาระหว่างภาษาดัตช์และภาษา ; ข้อมูลของวิกิพจนานุกรมภาษาอังกฤษวิกิพจนานุกรมภาษาดัตช์และวิกิพีเดียถูกใช้กับแพลตฟอร์มการแปลด้วยเครื่องApertium [37]
  • การก่อสร้างของพจนานุกรมเครื่องสามารถอ่านได้โดย parser NULEX ซึ่งรวมทรัพยากรภาษาศาสตร์เปิด: อังกฤษวิกิWordNetและVerbNet [38]ตัวแยกวิเคราะห์ NULEX ครูภาษาอังกฤษพจนานุกรมสำหรับข้อมูลเครียด (กริยา) รูปพหูพจน์และบางส่วนของคำพูด (คำนาม)
  • การรู้จำและการสังเคราะห์เสียงโดยที่ Wiktionary ถูกใช้เพื่อสร้างพจนานุกรมการออกเสียงโดยอัตโนมัติ [39]มีการเรียกข้อมูลคู่การออกเสียงคำจากภาษาวิกิพจนานุกรม 6 ฉบับ (เช็กอังกฤษฝรั่งเศสสเปนโปแลนด์และเยอรมัน) ออกเสียงในแง่ของสัทอักษรสากล [k] ASRระบบบนพื้นฐานของภาษาอังกฤษวิกิพีเดียมีอัตราความผิดพลาดคำสูงสุดที่แต่ละฟอนิมที่สามจะต้องมีการเปลี่ยนแปลง [41]
  • วิศวกรรมออนโทโลยี[42]และการสร้างเครือข่ายความหมาย [43]
  • การจับคู่อภิปรัชญา [44]
  • ทำให้เข้าใจง่ายข้อความ Medero & Ostendorf [45]ประเมินความยากของคำศัพท์ ( การตรวจจับระดับการอ่าน ) ด้วยความช่วยเหลือของข้อมูล Wiktionary ตรวจสอบคุณสมบัติของคำที่ดึงมาจากรายการ Wiktionary (ความยาวของคำจำกัดความและPOSความรู้สึกและจำนวนการแปล) Medero & Ostendorf คาดหวังไว้เช่นนั้น
    • (1) คำทั่วไปมักจะมีหลายส่วนของคำพูด
    • (2) คำทั่วไปที่มีแนวโน้มที่จะมีหลายประสาทสัมผัส
    • (3) คำทั่วไปมีแนวโน้มที่จะได้รับการแปลเป็นหลายภาษา คุณลักษณะเหล่านี้ที่ดึงมาจากรายการ Wiktionary มีประโยชน์ในการแยกแยะประเภทคำที่ปรากฏในบทความSimple English Wikipediaจากคำที่ปรากฏในบทความเทียบเคียงภาษาอังกฤษมาตรฐานเท่านั้น
  • เป็นส่วนหนึ่งของการพูดการติดแท็ก Li et al. (2012) [46]สร้างขึ้นพูดได้หลายภาษา POS-taggers แปดภาษายากจนบนพื้นฐานของภาษาอังกฤษพจนานุกรมและซ่อนมาร์คอฟรุ่น [l]
  • วิเคราะห์ความเชื่อมั่น [47]

ดูสิ่งนี้ด้วย

หมายเหตุ

  1. ^ URL ปัจจุบันวิกิพีเดียเป็นwww.wiktionary.org
  2. ^ จำนวนบทความทั้งหมดในวิกิพจนานุกรมอยู่ที่นี่ สถิติรายละเอียดโดยประเภทคำมีอยู่ที่นี่[1]
  3. ^ รายชื่อผู้ใช้ที่เป็นภาษาอังกฤษพจนานุกรมบัญชีระบุว่าได้รับสถานะ "บอท"
  4. ^ HồNgọcĐức,เวียดนามพจนานุกรมโครงการฟรี รายละเอียดในวิกิพจนานุกรมภาษาเวียดนาม
  5. ^ " วิกิพีเดีย / โลโก้ " Meta-วิกิพีเดีย, มูลนิธิวิกิมีเดีย
  6. ^ [ผู้แปล -l] 56 วิกิพจนานุกรมมีโลโก้ที่แปลเป็นภาษาท้องถิ่น
  7. ^ บทความฉบับเต็มไม่มีให้บริการทางออนไลน์ [16]
  8. ^ ในการอ้างอิงนี้ผู้เขียนอ้างถึง Wiktionary ซึ่งเป็นส่วนหนึ่งของเว็บไซต์ Wikipedia:ดัดแปลงมาจากบทความโดย Naomi DeTullio (2006) "Wikis สำหรับบรรณารักษ์" (PDF) NETLS News # 142 . ระบบห้องสมุดเท็กซัสตะวันออกเฉียงเหนือ น. 15. ที่เก็บไว้จากเดิม (PDF จดหมายข่าว)เมื่อวันที่ 5 มิถุนายน 2007 สืบค้นเมื่อ21 เมษายน 2550 .
  9. ^ เช่นเปรียบเทียบโครงสร้างรายการและกฎการจัดรูปแบบในภาษาอังกฤษพจนานุกรมและรัสเซียพจนานุกรม
  10. ^ ใบเสนอราคาดึงมาจากวิกิพจนานุกรมภาษารัสเซียเท่านั้น [34]
  11. ^ หากมีสัญกรณ์ IPA หลายรายการในหน้า Wiktionary - ไม่ว่าจะเป็นภาษาอื่นหรือสำหรับรูปแบบการออกเสียงการออกเสียงแรกจะถูกแยกออก [40]
  12. ^ ซอร์สโค้ดและผลลัพธ์ของการติดแท็ก POS มีอยู่ที่ https://code.google.com/p/wikily-supervised-pos-tagger

อ้างอิง

การอ้างอิง

  1. ^ วิกิมีเดีย 's มีเดียวิกิ API: Sitematrix สืบค้นเมื่อพฤษภาคม 2021 จากข้อมูล: Wikipedia statistics / meta.tab
  2. ^ "วิกิพีเดียรายชื่อผู้รับจดหมายอภิปรายเก็บประกาศการเปิดตัวของโครงการวิกิว่า" สืบค้นเมื่อ3 พฤษภาคม 2554 .
  3. ^ รายชื่อผู้รับจดหมายของ Wikipedia จัดเก็บการอภิปรายจาก Larry Sanger ให้แนวคิดเกี่ยวกับ Wiktionary - สืบค้นเมื่อ 3 พฤษภาคม 2554
  4. ^ https://www.wiktionary.org/
  5. ^ TheDaveBot ที่จัดเก็บ 11 ตุลาคม 2007 ที่เครื่อง Wayback , TheCheatBot ที่จัดเก็บ 11 ตุลาคม 2007 ที่เครื่อง Wayback , Websterbot ที่จัดเก็บ 11 ตุลาคม 2007 ที่เครื่อง Wayback , PastBot ที่จัดเก็บ 11 ตุลาคม 2007 ที่เครื่อง Wayback , NanshuBot เก็บถาวรเมื่อวันที่ 11 ตุลาคม 2550 ที่ Wayback Machine
  6. ^ รายละเอียดสถิติณ วันที่ 1 กรกฎาคม 2013
  7. ^ LXbot เก็บเมื่อวันที่ 24 พฤษภาคม 2551 ที่ Wayback Machine
  8. ^ สถิติวิกิพจนานุกรม
  9. ^ " Wiktionary talk: Wiktionary Logo ", English Wiktionary, Wikimedia Foundation
  10. ^ "วิกิพจนานุกรม / โลโก้ / รีเฟรช / โหวต ", Meta-Wiki, มูลนิธิ Wikimedia
  11. ^ phab: T139255
  12. ^ m: วิกิพีเดีย / โลโก้สถิติการใช้งาน
  13. ^ "วิกิพีเดีย: เกณฑ์สำหรับการรวม" วิกิพจนานุกรม. สืบค้นเมื่อ13 มีนาคม 2558 .
  14. ^ วิกิมีเดีย 's มีเดียวิกิ API: Siteinfo สืบค้นเมื่อพฤษภาคม 2021 จากData: Wikipedia statistics / data.tab
  15. ^ "วิกิสถิติ" Meta.Wikimedia.org . สืบค้นเมื่อ11 กันยายน 2563 .
  16. ^ Lepore 2006
  17. ^ David Brooks "สารานุกรมอินเทอร์แอกทีฟออนไลน์ไม่ได้มีไว้สำหรับคนที่ชอบฟังเพลงอีกต่อไปแล้วเพราะทุกคนดูเหมือนจะต้องการมันมากกว่าที่เคย!" The Nashua Telegraph (4 สิงหาคม 2547)
  18. ^ แม็ PC 2005
  19. ^ Kurmas 2010
  20. ^ เมเยอร์และ Gurevych 2012พี 140.
  21. ^ Zesch มุลเลอร์และ Gurevych 2008พี 4, รูปที่ 1.
  22. ^ Meyer & Gurevych 2010 , p. 40.
  23. ^ Krizhanovsky, การเปลี่ยนแปลง 2010พี 1.
  24. ^ Hellmann & Auer 2013พี 302, น. 16 ใน PDF
  25. ^ Hellmann, Brekle & Auer 2012พี 3, ตารางที่ 1.
  26. ^ DBpedia Wiktionary Archived 4 พฤษภาคม 2013 ที่ Wayback Machine
  27. ^ Hellmann, Brekle & Auer 2012 , PP. 8-9
  28. ^ Hellmann, Brekle & Auer 2012พี 10.
  29. ^ Hellmann, Brekle & Auer 2012พี 11.
  30. ^ JWKTL
  31. ^ Zesch มุลเลอร์และ Gurevych 2008
  32. ^ wikokit
  33. ^ Krizhanovsky, แปลง 2010
  34. ^ a b Smirnov และคณะ 2555 .
  35. ^ Krizhanovsky, การเปรียบเทียบ 2010
  36. ^ นิรุกติศาสตร์ WordNet
  37. ^ Otte & เยอร์ส 2011
  38. ^ McFate & Forbus 2011
  39. ^ Schlippe, Ochs และชูลทซ์ 2012
  40. ^ Schlippe, Ochs และชูลทซ์ 2012พี 4802.
  41. ^ Schlippe, Ochs และชูลทซ์ 2012พี 4804.
  42. ^ เมเยอร์และ Gurevych 2012
  43. ^ http://conceptnet5.media.mit.edu
  44. ^ หลินและ Krizhanovsky 2011
  45. ^ Medero & OSTENDORF 2009
  46. ^ ลี่Graça & Taskar 2012
  47. ^ Chesley และคณะ 2006

แหล่งที่มา

  • Krizhanovsky, Andrew (2010) "การแปลงโครงสร้างรายการวิกิพจนานุกรมเป็นตารางและความสัมพันธ์ในสคีมาฐานข้อมูลเชิงสัมพันธ์". arXiv : 1011.1368 [ cs ]
  • Krizhanovsky, Andrew (2010) "การเปรียบเทียบพจนานุกรมวิกิพจนานุกรมเปลี่ยนเป็นรูปแบบที่เครื่องอ่านได้" arXiv : 1006.5040 [ cs ]
  • Kurmas, Zachary (กรกฎาคม 2010). Zawilinski: ห้องสมุดสำหรับการศึกษาไวยากรณ์ในวิกิ การดำเนินการของการประชุมวิชาการนานาชาติครั้งที่ 6 เรื่อง Wikis และการทำงานร่วมกันแบบเปิด Gdansk, โปแลนด์ สืบค้นเมื่อ29 กรกฎาคม 2554 .
  • หลินเฟยหยู; Krizhanovsky, Andrew (2011). "การจับคู่ภววิทยาหลายภาษาตามข้อมูล Wiktionary ที่เข้าถึงได้ผ่าน SPARQL endpoint" Proc. ของการประชุมรัสเซียที่ 13 ได้ที่ห้องสมุดดิจิตอล RCDL'2011 โวโรเนจรัสเซีย หน้า 19–26 arXiv : 1109.0732 รหัส : 2011arXiv1109.0732L .
  • แม็คเฟต, คลิฟตันเจ.; ฟอร์บัสเคนเน็ ธ ดี. (2011). "NULEX: เปิดใบอนุญาตคุ้มครองกว้างศัพท์" (PDF) ครั้งที่ 49 การประชุมประจำปีของสมาคมภาษาศาสตร์: เทคโนโลยีภาษามนุษย์, การประชุมวิชาการ พอร์ตแลนด์โอเรกอนสหรัฐอเมริกา: สมาคมภาษาศาสตร์คอมพิวเตอร์ หน้า 363–367 ISBN 978-1-932432-88-6.
  • Smirnov A, Levashova T, Karpov A, Kipyatkova I, Ronzhin A, Krizhanovsky A, Krizhanovsky N (2012) "การวิเคราะห์คลังคำพูดของวิกิพจนานุกรมภาษารัสเซีย" การวิจัยทางวิทยาการคอมพิวเตอร์ . 56 : 101–112 arXiv : 2002.00734 CiteSeerX  10.1.1.694.9627 . ดอย : 10.13053 / rcs-56-1-11 . S2CID  10726045 .
  • "วิกิพจนานุกรม" . เว็บไซต์ 101 อันดับแรก นิตยสารพีซี . Ziff Davis วันที่ 6 เมษายน 2005 ที่จัดเก็บจากเดิมในวันที่ 21 ธันวาคม 2005 สืบค้นเมื่อ16 ธันวาคม 2548 .

ลิงก์ภายนอก