nlp - प्राकृतिक अंग्रेजी भाषा शब्द



(4)

किसने कहा था कि 1 मिलियन शब्द थे? विकिपीडिया के अनुसार, ऑक्सफ़ोर्ड इंग्लिश डिक्शनरी में केवल 600,000 है और ओईडी उपयोग की जाने वाली सभी तकनीकी और कठोर शब्दों को शामिल करने की कोशिश करता है।

https://src-bin.com

मुझे सबसे व्यापक अंग्रेज़ी शब्द सूची की आवश्यकता है, मैं कई तरह की भाषा प्रसंस्करण कार्यों के लिए मिल सकता हूं, लेकिन मुझे इंटरनेट पर कुछ भी नहीं मिल सकता है जिसकी अच्छी गुणवत्ता है।

विदेशी और / या तकनीकी शब्दों सहित अंग्रेजी भाषा में 1,000,000 शब्द हैं।

क्या आप कृपया ऐसे स्रोत (या 500 के करीब शब्दों) का सुझाव दे सकते हैं जिसे इंटरनेट से डाउनलोड किया जा सकता है, जो शायद थोड़ा वर्गीकृत हो? क्या आप अपने भाषा संसाधन अनुप्रयोगों के लिए उपयोग करते हैं?


Answer #1

मैंने नियंत्रित / प्राकृतिक अंग्रेजी और भाषा डोमेन ज्ञान प्रसंस्करण पर पर्ड्यू के लिए शोध किया।

मैं attempto परियोजना पर एक नज़र डालना होगा: http://attempto.ifi.uzh.ch/site/description/ जो एक नियंत्रित प्राकृतिक अंग्रेजी निर्माण में मदद करने के लिए एक परियोजना है।

आप अपना पूरा शब्द शब्दकोश डाउनलोड कर सकते हैं: http://attempto.ifi.uzh.ch/site/downloads/files/clex-6.0-080806.zip इसमें ~ 100,000 प्राकृतिक अंग्रेजी शब्द हैं।

आप डोमेन विशिष्ट शब्दों के लिए अपना स्वयं का शब्दकोश भी प्रदान कर सकते हैं, यही हमने हमारे शोध में किया है वे प्राकृतिक अंग्रेजी पाठ को पार्स और स्वरूपित करने के लिए webservices ऑफ़र करते हैं


Answer #2

` मिलियन 'शब्द' धोखेबाजी के साथ रोल ', मैं देखता हूं ;-)

अपने शब्द को कैसे लंबे समय तक सूचीबद्ध किया जाए: एक संज्ञा दी गई है, निम्न में से कोई भी इसे जोड़ें: गैर-, छद्म-, अर्द्ध, कृत्रिम, -जीक, ...; क्रियाओं आदि के लिए उत्परिवर्तनीय परिवर्तन


Answer #3

सीधे विकिपीडिया के अर्क की कोशिश करें: http://dbpedia.org