Lewati ke konten

Kamus

Label Frekuensi Kamus

HanyuGuide menampilkan label frekuensi subtitle yang luas, bukan peringkat mentah. Label ini membantu pelajar memprioritaskan kata tanpa menyiratkan penggunaan nyata yang tepat di semua konteks.

Batas Label

Peringkat SUBTLEX-CH Label HanyuGuide
1-1,000 Sangat umum
1,001-5,000 Umum
5,001-20,000 Kurang umum
20,001+ Jarang
Tidak ada peringkat yang cocok Data subtitle belum cukup

Sumber dan Metode

Label frekuensi berasal dari SUBTLEX-CH: Chinese Word and Character Frequencies Based on Film Subtitles oleh Qing Cai dan Marc Brysbaert, PLOS ONE 5(6): e10729. Dataset ini dilisensikan di bawah lisensi Creative Commons Attribution 4.0 International. HanyuGuide menormalkan dan memetakan peringkat frekuensi kata yang dipublikasikan menjadi label frekuensi untuk pelajar.

Korpus sumber didasarkan pada subtitle film dan televisi, sehingga label ini paling tepat dibaca sebagai tolok ukur frekuensi subtitle, bukan level HSK, level buku teks, atau peringkat universal frekuensi lisan.

Sumber: artikel PLOS ONE, file frekuensi pendukung, dan cermin dataset Figshare.

Mengapa Peringkat Mentah Disembunyikan

Peringkat mentah dapat terlihat lebih presisi daripada kenyataannya. Entri kamus dapat memiliki beberapa bacaan, ejaan alternatif, atau perbedaan normalisasi sumber, jadi HanyuGuide saat ini memakai bucket kasar di halaman publik dan tidak menyertakan nilai peringkat mentah dalam respons API agen dan mobile publik.

Lihat kredit open-source untuk pemberitahuan sumber data lengkap.