พจนานุกรม
ป้ายความถี่ในพจนานุกรม
HanyuGuide แสดงป้ายความถี่ในคำบรรยายแบบกว้างแทนอันดับดิบ ป้ายเหล่านี้ช่วยให้ผู้เรียนจัดลำดับคำโดยไม่สื่อว่าความถี่การใช้จริงแม่นยำในทุกบริบท
ขอบเขตของป้าย
| อันดับ SUBTLEX-CH | ป้าย HanyuGuide |
|---|---|
| 1-1,000 | พบบ่อยมาก |
| 1,001-5,000 | พบบ่อย |
| 5,001-20,000 | พบไม่บ่อย |
| 20,001+ | พบยาก |
| ไม่มีอันดับที่ตรงกัน | ข้อมูลคำบรรยายไม่เพียงพอ |
แหล่งข้อมูลและวิธีการ
ป้ายความถี่มาจาก SUBTLEX-CH: Chinese Word and Character Frequencies Based on Film Subtitles โดย Qing Cai และ Marc Brysbaert, PLOS ONE 5(6): e10729 ชุดข้อมูลนี้อยู่ภายใต้ สัญญาอนุญาต Creative Commons Attribution 4.0 International. HanyuGuide ปรับมาตรฐานและแปลงอันดับความถี่คำที่เผยแพร่เป็นป้ายความถี่สำหรับผู้เรียน
คลังข้อมูลต้นทางอิงจากคำบรรยายภาพยนตร์และโทรทัศน์ ดังนั้นควรอ่านป้ายเหล่านี้เป็นเกณฑ์ความถี่ในคำบรรยาย ไม่ใช่ระดับ HSK ระดับตำรา หรืออันดับความถี่การพูดแบบสากล
แหล่งข้อมูล: บทความ PLOS ONE, ไฟล์ความถี่ประกอบ, และ สำเนาชุดข้อมูลบน Figshare.
เหตุผลที่ซ่อนอันดับดิบ
อันดับดิบอาจดูแม่นยำเกินจริง รายการพจนานุกรมอาจมีหลายคำอ่าน การสะกดทางเลือก หรือความแตกต่างจากการปรับมาตรฐานแหล่งข้อมูล ดังนั้น HanyuGuide จึงใช้กลุ่มกว้างบนหน้าสาธารณะและไม่ใส่ค่าอันดับดิบในคำตอบ API สำหรับเอเจนต์และมือถือแบบสาธารณะ
ดูประกาศแหล่งข้อมูลฉบับเต็มได้ที่ เครดิตโอเพนซอร์ส