Перейти к содержимому

Словарь

Частотные метки словаря

HanyuGuide показывает широкие метки частотности в субтитрах вместо сырых рангов. Эти метки помогают расставлять приоритеты в изучении слов, не подразумевая точное употребление во всех контекстах.

Границы меток

Ранг SUBTLEX-CH Метка HanyuGuide
1-1,000 Очень частое
1,001-5,000 Частое
5,001-20,000 Менее частое
20,001+ Редкое
Нет совпадающего ранга Недостаточно данных субтитров

Источник и метод

Частотные метки получены из SUBTLEX-CH: Chinese Word and Character Frequencies Based on Film Subtitles, Qing Cai и Marc Brysbaert, PLOS ONE 5(6): e10729. Набор данных распространяется по лицензии Creative Commons Attribution 4.0 International. HanyuGuide нормализует опубликованные ранги частотности слов и сопоставляет их с метками для изучающих язык.

Исходный корпус основан на субтитрах фильмов и телепередач, поэтому эти метки следует читать как ориентиры частотности в субтитрах, а не как уровни HSK, уровни учебников или универсальные рейтинги устной речи.

Источники: статья PLOS ONE, дополнительные частотные файлы, и зеркало набора данных Figshare.

Почему сырые ранги скрыты

Сырые ранги могут выглядеть точнее, чем они есть. У словарных статей могут быть несколько чтений, альтернативные написания или различия нормализации источника, поэтому HanyuGuide использует широкие группы на публичных страницах и не включает сырые ранги в публичные ответы агентского и мобильного API.

Полное уведомление об источнике данных см. в разделе Благодарности с открытым исходным кодом.