Қазақ тілі және жасанды интеллект
немесе менен сізге дап-дайын ғылыми диссертация.
Жалпы, қазіргі таңда ChatGPT сияқты әртүрлі жасанды интеллект модельдері өмірге келіп, қай-қайсымыздың да жұмысымызды жеңілдетіп кетті. Тіпті, әбден еріншек қып тастады.
Қазақтың жалпақ һәм күнделікті тілімен айтқанда, ет асқанда салатын қамырды бұрын қолдан жайсақ енді дүкеннен дайын жайма сатып алып пісіре салу - күнделікті әдетке айналып келеді. Жо-жоқ, әркім өзі біледі, дайын жайма сала ма әлде өзі қолдан жасай ма. Мораль оқығалы жатқан жоқпын.
Айтпағым, еттің жаймасын өзің қолдан ысқанның артында кәдімгідей процесс жатыр. Ол үшін жақсы ұн табу (әрине, ол осы күні проблема емес), оның су-тұзын келістіріп араластыра білу, дұрыстап илей білу, жақсылап жая білу (біреу қалың болғанды ұнатады, біреу жұқа болғанын қалайды), сосын оны дұрыстап кесу немесе тұтас қазанға салу, оны дұрыстап қазаннан шығарып алу деген сияқты қабілеттер керек.
Яғни, дүкеннен жайма сатып алу - уақыттан ұтасың, тез піседі, бәлкім дәмді (әрине, біреулер үшін) әрі көп бас қатырмайсың.
Алайда, дүкеннен сатып алған жайманың параметрлерін басқара алмайсың. Параметр деген не? Ол жайманың ұнын (мысалы, біреулер етке қара ұннан немесе бірінші сорт ұннан жасалған қамыр салғанды ұнатады), тұзын, қалыңдығын, көлемін (біреулер тұтас дөңгелек қамыр салады, жапырақтамайды), ішіндегі жұмыртқасын (біреулерге жұмыртқа жақпайды), т.с.с.
Мына жасанды интеллект деген пәлекет те дәл сондай. Біреудің дайын тұрған жасанды интеллектісін ала салған, қолданған оңай. Ол үшін арнайы бір қабілетті меңгеріп қажет емес. 500 теңгеге жайма сатып алған сияқты, 10.000 теңгеге ай сайын ЖИ сатып алып отыра бересің. Бірақ, ол не ұсынса, соған риза боласың. Сол аралықта сен 1) ЖИ жасау қабілетіңнен айрылып жатасың және 2) Дайын затқа қанағат тұтасың.
Осыдан кеп “Неге ЖИ қазақша ананы істей алмайды, мынаны істей алмайды?” деген сөз шығады. Немесе “Уақыт құртып ЖИ жасағанша, дайын тұрғанды сатып алмайсың ба? Қайтадан белсебет құрастырып не керек?” деген әңгімелер шығады.
Оның орнына, біздің университеттер әр саладағы мамандарды (дәрігерлер, қаржыгерлер, заңгерлер, филологтар, т.с.с.) өзімізге тән ЖИ модель жасауға үйреткен дұрыс.
Мәселен, филологтар немесе қазақ тілінің мамандарын мынадай ЖИ құралын жасауға үйретуге болады.
Айталық, сіздің ойыңызға бір мақал не мәтел кеп тұр. Не жартысын білмейсіз, не бір сөзін ұмытып қалғансыз. Қайтпек керек? Гуглден іздейсіз. Ал ол ескі мақал болса ше? Гуглден табылмаса?
Осы жерде ЖИ көмекке келеді. Яғни, өзіңіз жасап алған ЖИ.
Ол үшін қысқа-нұсқа айтқанда:
1) Жүздеген, мыңдаған мақал-мәтелді жинайсыз
2) Токенизация жасайсыз
3) Маскиң (бетперде) жасайсыз. Мысалы: “Етікші [MASK] жарымайды”.
4) Сосын модельді жасырын сөзді табуға үйретесіз.
5) Тест жасайсыз
6) Жұртшылыққа жариялайсыз.
Заманның дамығаны соншалық, мұның барлығы ПӘШТИ тегін жасалады.
ЖИ оқыту үшін Google Colab қолдансаңыз болады. Ақылы нұсқасы айына 10 мың теңгеге жетпейді. Ал бұл жұмыс бір айға жетпей аяқталады.
Іргетас ретінде Google-дің mBERT көптілді моделін алса болады.
Үйрету тілі - Python.
Трансформер мен платформа ретінде Huggingface қолданасыз.
Ал қазақ тілінің маманы, әдебиетші, филолог ретінде менің осы мәтінімді ChatGPT-ге салып жіберсеңіз, кодты өзі жазып береді. Яғни, бұрынғыдай программалауды да үйрену қажет емес.
Ойлап қараңызшы? Сіз өз қолыңызбен жасанды интеллект жасадыңыз. Ал күні кеше ол туралы ештеңе білмеген едіңіз.
Міне, менің “жасанды интеллекті үйреніңіздер” деп қоймай жүргенім осы.
Нәтижесінде, қазақ тілін енді үйреніп жүргендерге, мектеп оқушыларына, мақал-мәтел зерттеушілерге, журналистерге, қарапайым бұқараға таптырмас құрал жасап бересіз.
Олар: “Етікші жарымас” деген мақал бар ед, соның толық нұсқасын айтып жіберші?” дейді. Сіздің жасанды интеллектіңіз оған “Етікші етікке жарымас” деп жауап қайтарады.
Керемет емес пе?
Үйреніңіздерші
Жазыл 👉
@timurdaninfo