Словарь
Частотные метки словаря
HanyuGuide показывает широкие метки частотности в субтитрах вместо сырых рангов. Эти метки помогают расставлять приоритеты в изучении слов, не подразумевая точное употребление во всех контекстах.
Границы меток
| Ранг SUBTLEX-CH | Метка HanyuGuide |
|---|---|
| 1-1,000 | Очень частое |
| 1,001-5,000 | Частое |
| 5,001-20,000 | Менее частое |
| 20,001+ | Редкое |
| Нет совпадающего ранга | Недостаточно данных субтитров |
Источник и метод
Частотные метки получены из SUBTLEX-CH: Chinese Word and Character Frequencies Based on Film Subtitles, Qing Cai и Marc Brysbaert, PLOS ONE 5(6): e10729. Набор данных распространяется по лицензии Creative Commons Attribution 4.0 International. HanyuGuide нормализует опубликованные ранги частотности слов и сопоставляет их с метками для изучающих язык.
Исходный корпус основан на субтитрах фильмов и телепередач, поэтому эти метки следует читать как ориентиры частотности в субтитрах, а не как уровни HSK, уровни учебников или универсальные рейтинги устной речи.
Источники: статья PLOS ONE, дополнительные частотные файлы, и зеркало набора данных Figshare.
Почему сырые ранги скрыты
Сырые ранги могут выглядеть точнее, чем они есть. У словарных статей могут быть несколько чтений, альтернативные написания или различия нормализации источника, поэтому HanyuGuide использует широкие группы на публичных страницах и не включает сырые ранги в публичные ответы агентского и мобильного API.
Полное уведомление об источнике данных см. в разделе Благодарности с открытым исходным кодом.