Kamus
Label Frekuensi Kamus
HanyuGuide menampilkan label frekuensi subtitle yang luas, bukan peringkat mentah. Label ini membantu pelajar memprioritaskan kata tanpa menyiratkan penggunaan nyata yang tepat di semua konteks.
Batas Label
| Peringkat SUBTLEX-CH | Label HanyuGuide |
|---|---|
| 1-1,000 | Sangat umum |
| 1,001-5,000 | Umum |
| 5,001-20,000 | Kurang umum |
| 20,001+ | Jarang |
| Tidak ada peringkat yang cocok | Data subtitle belum cukup |
Sumber dan Metode
Label frekuensi berasal dari SUBTLEX-CH: Chinese Word and Character Frequencies Based on Film Subtitles oleh Qing Cai dan Marc Brysbaert, PLOS ONE 5(6): e10729. Dataset ini dilisensikan di bawah lisensi Creative Commons Attribution 4.0 International. HanyuGuide menormalkan dan memetakan peringkat frekuensi kata yang dipublikasikan menjadi label frekuensi untuk pelajar.
Korpus sumber didasarkan pada subtitle film dan televisi, sehingga label ini paling tepat dibaca sebagai tolok ukur frekuensi subtitle, bukan level HSK, level buku teks, atau peringkat universal frekuensi lisan.
Sumber: artikel PLOS ONE, file frekuensi pendukung, dan cermin dataset Figshare.
Mengapa Peringkat Mentah Disembunyikan
Peringkat mentah dapat terlihat lebih presisi daripada kenyataannya. Entri kamus dapat memiliki beberapa bacaan, ejaan alternatif, atau perbedaan normalisasi sumber, jadi HanyuGuide saat ini memakai bucket kasar di halaman publik dan tidak menyertakan nilai peringkat mentah dalam respons API agen dan mobile publik.
Lihat kredit open-source untuk pemberitahuan sumber data lengkap.