Saltar al contenido

Diccionario

Etiquetas de frecuencia del diccionario

HanyuGuide muestra etiquetas amplias de frecuencia en subtítulos en lugar de rangos sin procesar. Estas etiquetas ayudan a priorizar palabras sin afirmar un uso exacto en todos los contextos.

Límites de las etiquetas

Rango SUBTLEX-CH Etiqueta de HanyuGuide
1-1,000 Muy común
1,001-5,000 Común
5,001-20,000 Poco común
20,001+ Raro
Sin rango coincidente Sin datos suficientes de subtítulos

Fuente y método

Las etiquetas de frecuencia se derivan de SUBTLEX-CH: Chinese Word and Character Frequencies Based on Film Subtitles, de Qing Cai y Marc Brysbaert, PLOS ONE 5(6): e10729. El conjunto de datos tiene licencia Creative Commons Atribución 4.0 Internacional. HanyuGuide normaliza y asigna los rangos publicados de frecuencia de palabras a etiquetas para estudiantes.

El corpus fuente se basa en subtítulos de cine y televisión, por lo que estas etiquetas deben leerse como referencias de frecuencia en subtítulos, no como niveles HSK, niveles de libros de texto ni rangos universales de habla.

Fuentes: artículo de PLOS ONE, archivos de frecuencia complementarios, y réplica del conjunto de datos en Figshare.

Por qué se ocultan los rangos sin procesar

Los rangos sin procesar pueden parecer más precisos de lo que son. Las entradas del diccionario pueden tener varias lecturas, escrituras alternativas o diferencias de normalización de la fuente, por eso HanyuGuide usa grupos amplios en páginas públicas y mantiene los rangos sin procesar fuera de las respuestas públicas de las API de agente y móvil.

Consulta los créditos de código abierto para ver el aviso completo sobre la fuente de datos.