शब्दकोश
शब्दकोश आवृत्ति लेबल
HanyuGuide कच्चे रैंक के बजाय व्यापक उपशीर्षक-आवृत्ति लेबल दिखाता है। ये लेबल हर संदर्भ में सटीक वास्तविक उपयोग का दावा किए बिना शब्दों को प्राथमिकता देने में मदद करते हैं।
लेबल सीमाएँ
| SUBTLEX-CH रैंक | HanyuGuide लेबल |
|---|---|
| 1-1,000 | बहुत आम |
| 1,001-5,000 | आम |
| 5,001-20,000 | कम आम |
| 20,001+ | दुर्लभ |
| मिलता-जुलता रैंक नहीं | पर्याप्त उपशीर्षक डेटा नहीं |
स्रोत और विधि
आवृत्ति लेबल SUBTLEX-CH: Chinese Word and Character Frequencies Based on Film Subtitles, Qing Cai और Marc Brysbaert, PLOS ONE 5(6): e10729, से निकाले गए हैं। डेटासेट Creative Commons Attribution 4.0 International लाइसेंस के तहत लाइसेंस प्राप्त है। HanyuGuide प्रकाशित शब्द-आवृत्ति रैंकों को सामान्य करता है और उन्हें सीखने वालों के लिए आवृत्ति लेबल में बदलता है।
स्रोत कॉर्पस फिल्म और टीवी उपशीर्षकों पर आधारित है, इसलिए इन लेबलों को उपशीर्षक-आवृत्ति संकेतक समझें, न कि औपचारिक HSK स्तर, पाठ्यपुस्तक स्तर या सार्वभौमिक बोली जाने वाली भाषा रैंक।
स्रोत: PLOS ONE लेख, सहायक आवृत्ति फ़ाइलें, और Figshare डेटासेट मिरर.
कच्चे रैंक क्यों छिपाए गए हैं
कच्चे रैंक जितने सटीक दिखते हैं, उतने नहीं होते। शब्दकोश प्रविष्टियों में कई पाठ, वैकल्पिक वर्तनी या स्रोत-सामान्यीकरण के अंतर हो सकते हैं, इसलिए HanyuGuide सार्वजनिक पृष्ठों पर व्यापक समूहों का उपयोग करता है और सार्वजनिक एजेंट तथा मोबाइल API प्रतिक्रियाओं से कच्चे रैंक मान हटाए रखता है।
पूरी डेटा-स्रोत सूचना के लिए ओपन-सोर्स श्रेय देखें।