शब्दकोश

शब्दकोश आवृत्ति लेबल

HanyuGuide कच्चे रैंक के बजाय व्यापक उपशीर्षक-आवृत्ति लेबल दिखाता है। ये लेबल हर संदर्भ में सटीक वास्तविक उपयोग का दावा किए बिना शब्दों को प्राथमिकता देने में मदद करते हैं।

लेबल सीमाएँ

SUBTLEX-CH रैंक	HanyuGuide लेबल
1-1,000	बहुत आम
1,001-5,000	आम
5,001-20,000	कम आम
20,001+	दुर्लभ
मिलता-जुलता रैंक नहीं	पर्याप्त उपशीर्षक डेटा नहीं

स्रोत और विधि

आवृत्ति लेबल SUBTLEX-CH: Chinese Word and Character Frequencies Based on Film Subtitles, Qing Cai और Marc Brysbaert, PLOS ONE 5(6): e10729, से निकाले गए हैं। डेटासेट Creative Commons Attribution 4.0 International लाइसेंस के तहत लाइसेंस प्राप्त है। HanyuGuide प्रकाशित शब्द-आवृत्ति रैंकों को सामान्य करता है और उन्हें सीखने वालों के लिए आवृत्ति लेबल में बदलता है।

स्रोत कॉर्पस फिल्म और टीवी उपशीर्षकों पर आधारित है, इसलिए इन लेबलों को उपशीर्षक-आवृत्ति संकेतक समझें, न कि औपचारिक HSK स्तर, पाठ्यपुस्तक स्तर या सार्वभौमिक बोली जाने वाली भाषा रैंक।

स्रोत: PLOS ONE लेख, सहायक आवृत्ति फ़ाइलें, और Figshare डेटासेट मिरर.

कच्चे रैंक क्यों छिपाए गए हैं

कच्चे रैंक जितने सटीक दिखते हैं, उतने नहीं होते। शब्दकोश प्रविष्टियों में कई पाठ, वैकल्पिक वर्तनी या स्रोत-सामान्यीकरण के अंतर हो सकते हैं, इसलिए HanyuGuide सार्वजनिक पृष्ठों पर व्यापक समूहों का उपयोग करता है और सार्वजनिक एजेंट तथा मोबाइल API प्रतिक्रियाओं से कच्चे रैंक मान हटाए रखता है।

पूरी डेटा-स्रोत सूचना के लिए ओपन-सोर्स श्रेय देखें।