Вэбсайтын цэс
Хэлний сонголт
Т.ПҮРЭВСҮРЭН: ҮГСИЙН ДАВТАМЖИЙГ ХАСАХГҮЙГЭЭР ТООЦВОЛ 108 БОТЬ 7,8 САЯ ҮГТЭЙ
Т.ПҮРЭВСҮРЭН: ҮГСИЙН ДАВТАМЖИЙГ ХАСАХГҮЙГЭЭР ТООЦВОЛ 108 БОТЬ 7,8 САЯ ҮГТЭЙ

Монголын уран зохиолын дээжис 108 ботийг 1993 онд эхлээд, хоёр дахь хэвлэл нь 2005 онд хэвлэгдсэн байдаг. ШУА-ийн Хэл зохиолын хүрээлэнгийн судлаачид үе үеийн зохиолчдын охь дээж бүтээлүүдийг багтаасан 108 ботийн цахим санг бүрдүүлж, холбогдох программ хангамжийг боловсруулжээ. Гэвч нийтийн хэрэглээ болгоход хөрөнгө санхүүгийн асуудал тулгараад буй аж. Цахим сангийн ажлыг санаачилж, гардан гүйцэтгэсэн ШУА-ийн Хэл зохиолын хүрээлэнгийн Хэрэглээний хэл шинжлэлийн салбарын эрдэм шинжилгээний ажилтан, доктор (Ph.D) Т.Пүрэвсүрэнтэй ярилцлаа.

-108 ботийн цахим санг бүрдүүлэх нь ямар ач холбогдолтой вэ?

-108 боть нь өөрөө судалгааны үнэтэй хэрэглэгдэхүүн болж чадах ихээхэн хэмжээний баримт. Ер нь аливаа судалгааны үр дүн үнэн зөвийг нотлох нэг хэмжүүр нь судалгааны эх хэрэглэгдэхүүн, баримтдаа оршино. Иймээс хэдий их хэмжээний хэрэглэгдэхүүнд түшиглэж судалгаа хийнэ, төдий хэмжээгээр судалгааны үр дүн баталгаатай, үнэн зөв байх оновчийн хэмжээ нь нэмэгдэнэ. Тиймээс судлаачдын судалгааны эх хэрэглэгдэхүүнээ бэлтгэхэд зарцуулдаг цаг, хөдөлмөрийг хөнгөвчлөхийн зэрэгцээ, олон талын оновчтой тоо баримт олоход нь туслах үүднээс хөмрөгийн хэл шинжлэлийн судалгааны ажлаа эхлүүлсэн юм. Техник технологи хурдацтай хөгжиж байгаа энэ үед хэл шинжлэлийн судалгааг үүнтэй уялдуулах шаардлага үүссэн. Тухайлбал, сүүлийн үед шинжлэх ухааны бүхий л салбарт  дэвшилтэт технологи нэвтэрч, шинжлэх ухааны салбарууд нь нэг цэгийн огтлолцол дээр асуудлыг олон талаас нь судлах шаардлага үүссэн, хэрэгцээ ч буй болсон. Тиймээс нийгмийн шинжлэх ухаан гэхэд судалгааны эх хэрэглэгдэхүүнээ бэлдэхдээ компьютер, мэдээллийн технологийн хөгжлийг ашиглах шаардлагатай болж байна. Үүнтэй холбоотойгоор цахим хэл шинжлэл, хөмрөгийн хэл шинжлэл гэж шинэ нэр томьёо гарч ирсэн. Манай улсад 2000 оноос хойш л энэ чиглэлийг хаа нэг дурдаж, ярих болсон учраас судалгааны үр дүн нь хангалттай бус байна. Дэлхий дахины хувьд 1950-60-аад оноос хөмрөгийн хэл шинжлэлийн судалгаа хийгдээд эхэлсэн байдаг. Хөмрөгийн хэл шинжлэлийн гол зорилгыг энгийнээр тодорхойлбол судлаачдад судалгааных нь шаардлагад нийцсэн эх хэрэглэгдэхүүн, баримтыг нь бүрдүүлж өгөх байдаг. Тиймээс эрдэм шинжилгээний зугаагүй хар ажил гэж нэрлэгддэг баримтын санг 108 ботийн хэмжээнд бүрдүүлээд байна.

-108 ботийн цахим сан гээд программыг хийгээд бэлэн болсон байна. Үүнийг хийхэд хэр хугацаа орсон бэ?

- Албан ёсоор 2012 онд Насан-Урт багш маань Монголд хүрэлцэн ирж, тухайн үед хүрээлэнгийн захирал байсан Болд багштай уулзаад энэ ажлыг эхлүүлэх талаар ярилцсан. Гэвч өмнө нь 2010 онд ерөнхийдөө санаа нь гараад эхэлчихсэн явж байсан. Ингээд хүрээлэнгийн хамт олон болон ӨМИС-ийн нөхөдтэйгөө хамтран 2014 онд дуусгасан. Энэ ажлыг хийхэд эхээ алдаагүй үнэн зөв оруулах нь хамгийн чухал. Барилгаар бол суурь нь гэсэн үг. Ганцхан үг алдаад юм уу, орхиод биччихэд л судалгааны үр дүн буруу гарах аюултай. Иймээс уг эхийг бэлдэхэд маш их цаг зарцуулсан. Эхээ бэлдсэний дараа программ бичих ажилдаа орж өгөгдлийн сан байгуулах, алгоритм бичих зэрэг ажлуудаа гүйцэтгэсэн дээ. Хайлтын программыг доктор (Ph.D) Д.Мөнхдэлгэр бичсэн.  

Монгол хэлний үгийн санг бүртгэж гаргасан баттай тооцоолол өнөөдрийг хүртэл байдаггүй. 1956 онд Б.Ренчин гуай “Монгол хэл бардаагаар буман үгтэй” гэж нэгэн судалгааны өгүүлэлдээ бичсэн байдаг. Өнөөдөр монгол хэлний үгийн сан яг тэд байна аа гээд хэлэх боломжгүй ч уран зохиолын түвшинд монголчууд өдий тооны үгийг ашиглаж байна аа гэж хэлэх боломж бүрдсэн.

-108 ботьд хэдэн үг орсон байна вэ? гэдгийг судлаад гаргасан гэсэн үг үү. Хэдэн үг хэрэглэсэн байна вэ?

- Тийм. 108 ботид оноосон нэр (хүний нэр, газар ус, улс орны нэр гэх мэт)-ийг оруулаад 250 мянган үг орсон байна. Тэгэхээр 108 ботийг уншсан хүн бол ямартаа ч 250 мянган үг мэддэг болохнээ гэж хэлж болно. Үгсийн давтамжийг хасахгүйгээр тооцвол 108 боть нийт 7,880,161 үгтэй. Англи хэл сурахад идэвхтэй хэрэглэгдэх 2000 үгийг цээжилсэн байхад өдөр тутмын ярианд асуудалгүй. Хятад хэл сурахад өргөн хэрэглээний 2500 ханз цээжлэхэд сонины мэдээ ойлгох хэмжээнд хүрнэ гэдэг ч юм уу, манайхаас бусад улс ийм баталгаатай тоо гаргаж тавиад байна. Гэтэл манайд ийм тоо гаргах гэхээр сан, хөмрөг нь бүрдээгүй. Одоо л уран зохиолын сан хөмрөг 108 ботийн хэмжээнд бүрдэж байна гэж ойлгож болно.

-Та докторын зэрэг хамгаалахдаа “Тунгалаг тамир” романы хөмрөг байгуулсан гэж сонссон. Зохиолч Лодойдамба гуай “Тунгалаг тамир” романыг бичихдээ хэдэн үг ашигласан байна вэ?

- Манай улсад л зохиолчийн үгийн сангийн толь буюу зохиолын толь гэж гараагүй байгаа болохоос ОХУ-д л гэхэд Пушкины зохиолын толь бичиг гэх зэргээр байдаг. Энэ сонирхолдоо хөтлөгдөн зууны шилдэг роман “Тунгалаг тамир”-ын үгийн санг бүртгэсэн юм. Тус роман 170 мянга орчим үгтэй. Эндээс үгийн давтамжийг гаргавал 19869 үгийн хүрээнд бичигдсэн. Харин үг ямар нэгэн нөхцөлөөр хэлбэржээгүй буюу үгийн үндсээрээ байгааг нь тооцоод үзэхээр 6246 үгтэй. Тэгэхээр Лодойдамба гуай “Тунгалаг тамир” романаа бичихийн тулд 6200 орчим үгэн дотор л эргэлдсэн байгаа юм. Ингээд харьцуулаад харахаар 6200 үг цөөхөн юм шиг санагдаж болох ч монгол хэлний идэвхтэй хэрэглээний үгээ гаргаад ирэхээр гадаад хүнд монгол хэлийг анхлан заахад 2000 орчим үгийг таниулж нүдлүүлсэн байхад боломжийн ойлголцоод байж болно гэж харагдаж байгаа юм. Гэхдээ үүнийг нарийн судалсны дараа л баталгаатай хэлэх ёстой.

-Монгол хэлний зөв бичих дүрэм өөрчлөгдөөд, зарим үгсийг арай өөрөөр бичих болсон. Тэгвэл 108 ботийг цахим болгоход зөв бичгийн талаасаа ч юм уу хүндрэл байсан уу?

-Саяхан “Зөв бичих зүйн журамласан толь” гарсан. 2008 онд “Монгол хэлний дэлгэрэнгүй тайлбар толь” гээд таван боть гарсан. Ер нь бол судлаачид бидний хувьд Дамдинсүрэн гуайн үсгийн дүрмийг баримталж яваа. Иргэдийн дунд буруу ташаа мэдээлэл тараад байсан болохоос зөв бичгийн дүрэм өөрчлөгдөөгүй. Хөмрөг үүсгэх явцад тухайн зохиолчийн онцлогоос хамаараад нутгийн аялгууны үг гарах тохиолдолд л асуудал үүснэ үү гэхээс зөв бичгийн дүрэм талаасаа асуудал гараагүй. Хэвлэлийн эхийн алдаа гарах тохиолдол байсан.

-108 ботийн цахим санг бүрдүүлснээр судлаачдад судалгааны хэрэглэгдэхүүн болно гэлээ. Жирийн иргэдэд ямар ашигтай вэ?

-Тухайн үгийн олон утгыг харж болно. Өгүүлбэрт хэрхэн хэрэглэж буй хэрэглээг харах боломжтой. Жишээ нь: “борог” гэдэг үгийг хайвал 1-108 ботийн аль аль ботид ямар өгүүлбэрт хэрхэн хэрэглэсэн нь гараад ирнэ. Сурагчдад тэр дундаа бага ангийн сурагчдад үгийн утгыг тайлбарлан жишээ өгүүлбэр зохиох даалгавар нэлээд өгдөг юм байна лээ. Үгийн тайлбарыг нь ч www.mongoltoli.mn –ээс харчихна. Харин өгүүлбэр зохиох гэхээр өдөр тутмын хэрэглээний хэдхэн өгүүлбэрийн хүрээнээс гарч чаддаггүй. Хүүхдэдээ жишээ болгох өгүүлбэр уншуулах гэхээр аль номын аль хэсэгт байгаа гэж эрэх үү? Ингэж эрнэ гэдэг өвсөн дундаас зүү олохоос ч хэцүү ажил. Тэгэхээр энэ программыг ашиглаад хүүхдэдээ тухайн үг орсон өгүүлбэрийг уншуулаад үүн дээр нь ургуулан бодож, сэтгүүлэх ажил хийвэл үр дүнтэй. Тухайлбал, дээр дурдсан “борог” гэдэг үг нь 108-ийн санд “46 удаа тохиолдож байна”.   Улаан ат хэсэг хивж, уулсын толгой ширтэн хэвтсэнээ алгуурхан босож, борог өвс уруулаараа хаман, тэрхэн хавьдаа эргэлдэж байв (Р.Нямдорж. Ах дүү хоёр)., Уулнаас ирэхлээр нь гахай шахаж байгаа юм шиг, өөрөө даахгүй борог хоол, өөрийн хийсэн гашуун усаар бордож, хэд хоног гадагш нь гаргалгүй хорьж байгаад, цалинг нь хурааж аваад л явуулчихдаг юм(Н.Надмид. Бүсгүйчүүдийн батальон)., Үнэн борог амьдралаасаа үнэтэй амьдарсангүй (Л.Торой. Титэм бадаг) гэх мэтээр маш олон жишээг уншиж болно.

-108 ботийн программаас үзэхэд хэрэглээнээс гарсан ч юм уу, содон үг байсан уу?

- Байлгүй яах вэ. Одоо санаанд орж байгаа нь Ц.Дамдинсүрэн гуайн “Гологдсон хүүхэн” туужид цүүвэн гэж үг байсан. Тэрэгний олон төрлийг тоочсон дотор ...хасаг тэрэг, төмөр тэрэг, сүйх тэрэг, цүүвэн тэрэг гэж байгаа юм. Энэ үг 108 ботид ганцхан удаа л орсон байна. Тэгэхээр бид тайлбар тольд энэ үг байгаа эсэхийг нягтлаад байсан тохиолдолд үгийн утга нь адил байна уу?, Салаа, шилжсэн утга нь уу?, Аль эсвэл төрөл үг үү? нутгийн аялгууны үг үү? гэдгийг тогтоох, монголчуудын ахуй амьдралдаа хэрэглэж байсан тэрэгний төрлүүдийг бүртгэх, бичлэгийн хувьд зөв үү? гээд л нэг үг юм шиг мөртөө маш их судалгаа шаардана даа. Монгол хэлний цахим тайлбар толио ч бид энэ сандаа тулгуурлан засварлах ажлыг хийж байна. Хэлний үгийн сан чинь өөрөө хөдөлгөөнтэй шинжтэй. Тухайлбал бидний аав, ээжийн үед “яг” гэдэг үгийг “баталгаатай нотолгоотой” гэсэн утгаар хэрэглэж байсан бол 1990 оны дунд үеэс “үгүй” гэж үгүйсгэсэн утгатай болж эхэлсэн. Энэ мэт жишээг хөмрөгийн сангаасаа олж харах боломжтой.

-Хэлний найруулгын таван төрөл байдаг. 108 боть уран зохиолын найруулгын төрөлдөө орж байна. Цаашид бусад төрлийнх нь хөмрөгийг байгуулснаар дээр хэлсэнчлэн хэдэн үг сурахад монголоор ойр зуураа чөлөөтэй ярьж болох вэ? гэсэн баттай тоо гарах нь ээ гэж ойлголоо?

-Яг зөв. Уран зохиол дээрээ нэмээд сонин нийтлэл, эрдэм шинжилгээ, албан бичиг, ярианы гэсэн төрлүүдээрээ хөмрөг байгуулчихвал баталгаатай тоо баримт хэлж чадахаар болно. Мөн монгол хэлний үгийн санд хяналт тавих боломж бүрдэнэ. Эх хэл маань гадаад үгэнд бохирдчихлоо гэдэг. Жилд хэдэн үг монгол хэлэнд орж нутагшаад, монгол хэлний нийт үгийн сангийн хэдэн хувийг эзлээд байгааг хөмрөгтөө суурилан баримт нотолгоотой гаргаад ирвэл иргэдийн энэ асуулт, төөрөгдөлд судалгаанд суурилсан баталгаат хариулт өгч чадна. Ийм хөмрөг байхгүй учраас бид өнөөдөр ойролцоогоор, багцаагаар гэдэг зүйл яриад сууж байна. Тэгвэл энэхүү сан хөмрөгийг бүрдүүлснээр үүнд хяналт тавих боломжтой.

Мөн цаашлаад сурах бичгийн хөмрөг байгуулснаар бага ангийн сурагчдын үгийн санг тогтоох боломжтой. Хүмүүс сурах бичгийн үг хэллэгийг их шүүмжилдэг. Бага ангийн хүүхэд байтугай бид нар ойлгохгүй байна гэдэг. Тэгвэл бага ангийн хүүхдүүдийн үгсийн сангийн хөмрөг бүрдүүлснээр тухайн хөмрөгийн үгийн сангийн хүрээнд л сурах бичгээ бичих боломжтой болно. Хүүхдүүдийг анги ахих тусам мэдэх ёстой үгээр нь баяжуулаад бага, дунд, ахлах ангийн сурагчдын мэдвэл зохих үгийн сангийн жагсаалтыг гаргах хэрэгтэй. ЕБС төгссөн хүүхдийн үгийн сангийн баялаг нь ийм байх ёстой гэдгийг ч нарийн тогтоож, сургалтад хэрэгжүүлэх боломж бүрдэх юм. Шалгалт шүүлэг авахад ч үгийн сангийн баялаг багатай гэх мэт асуудал үүсэхгүй. Үүнийг хийхэд хүн хүч, хөрөнгө санхүү л шаардлагатай болохоос хийж чадахгүй, боломжгүй ажил биш.

Ер нь тэгээд компьютерийн хэл шинжлэлийн хөгжил нь машин орчуулгад хийхэд л чиглэж анх үүссэн түүхтэй, одоо ч бас энэ чиглэлдээ ажилласаар л байна. Гүүгл дээр монгол хэлний машин орчуулга байгаа боловч хангалтгүй орчуулаад байгаа шүү дээ. Харин гадаад хэлнүүд хоорондоо бол боломжийн орчуулагдаад байгаа нь нэг талаас хөмрөгөө бүрдүүлчихсэн болохоор тэр л дээ. Цаашлаад хөмрөгийг зөвхөн үгийн сангийн түвшинд л байгуулна гэж ойлгож болохгүй. Хэлний цөм ба өнгөн бүтцийг компьютерт таниулахын тулд хэлний нэгж, түвшин бүрээр хөмрөгөө байгуулах, тэр дундаа өгүүлбэрийн хөмрөг байгуулах зэргээр улам хөгжүүлэх шаардлагатай.

-Цахим санг хэрэглээ болгоход хөрөнгө мөнгө шаардлагатай гэсэн. Хэдий хэрийн санхүүжилт шаардлагатай байна вэ?

-Одоо бол зөвхөн миний компьютер дээр байна. Манай хүрээлэнгийнхэн болон манай хүрээний судлаачид хааяа энэ үгийг хайгаад өгөөч, энэ хэлц хэллэгийн утга уран зохиолын баримтад яаж илэрсэн байна гэх мэтээр иймэрхүү байдлаар л ашиглаж байна даа. Бас хөрөнгө оруулагчид нэг буруу ташаа ойлголттой байдаг. Ганц удаа санхүүжилт олгочиход л болчих юм шиг санадаг. Тэгвэл аливаа судалгааны ажил тасралтгүй үргэлжилж байж л судалгааны үр дүн сайн гарна. Тиймээс тасралтгүй санхүүжилт шаардлагатай байдаг.

-Таны хувьд 108 ботийн цахим санг бүрдүүлэх ажлыг гардаж хийж байгаа хүн. Анх үүнийг хийх санаа хэрхэн төрсөн бэ?

-Би 2003 онд МУИС-ийг төгсөөд хүрээлэнд ажилд орсон. Тэгэхэд “Монгол хэлний дэлгэрэнгүй тайлбар толь таван боть”-ийг хийж байлаа. Манай хүрээлэнд 1970-1980 оны эхэн хүртэл бүрдүүлсэн, өөрөөр хэлбэл Цэвэлийн толь хэвлэгдсэний дараа судалгааны хэрэглэгдэхүүн шаардлагатай гэж үзээд улсын санхүүжилтээр нэгийг нь тухайн үеийн ханшаар 5 мөнгөөр хийлгэсэн таван сая үгтэй картын сан байсан. Таван ботийг хийхийн тулд картын сан шүүх ажил толийн багт ажиллаж байсан залуучууд бидэнд ноогдсон. 1970-80-аад онд хийгдсэн гэхээр тоос шорооноос эхлээд маш хүнд нөхцөлд ажиллаж байсан л даа. 2008 онд таван боть толь хэвлэгдэж, би 2009 онд ӨМӨЗО-ын их сургуульд компьютер хэл шинжлэлийн чиглэлээр сурсан. Мэдээлэл технологийн эринд бүх юм цахимжчихаад байхад тэр таван сая карт шүүгээд тоосны харшилтай болох нь нэг талаараа утгагүйн дээр цаг үеэсээ судалгааны ажил маань хоцрогдож байгаа мэдрэмж, харуусал төрөх, нөгөө талаас цаг, бие барсан ажил байсан л даа. Иймээс л энэ бүхэл бүтэн 1 өрөө эзэлж байгаа картын санг компьютерт оруулчхаад хүссэн үгээ хайлтаар хэдхэн секунд, минутын дотор гаргаж ирээд, тухайн үгийн  бүтэц, утга, үүрэг, хэрэглээг шууд харчихдаг болох юм сан гэж боддог байлаа. Энэ ажил нь тухайн үед манай улсад л хийж эхлээгүй байсан болохоос биш олон улсад бол аль хэдийн хийгээд судалгаандаа хэрэглэж хэвшчихсэн асуудал байсан. Коллинс, Дүдэн гэх мэт алдартай толь бичгүүдийн цаана тухайн толь бичгийг боловсруулахад зориулан бүрдүүлсэн тусгай хөмрөг заавал байдаг. Ингээд ӨМИС-д Насан-Урт багшийнхаа удирдлагад суралцахдаа бусадтайгаа хамтран “Монгол хэлний картын сангийн хайлтын программ болон Монгол уран зохиолын дээжис 108 ботийн цахим сан”-ийн программ хангамжийг боловсруулсан юм.


Бусад мэдээлэл