Гл. ас. д-р Георги Чолаков1), доц. д-р Емил Дойчев1), проф. д-р Светла Коева2)
1)Пловдивски университет „Паисий Хилендарски“
2)Институт за български език – БАН
https://doi.org/10.53656/math2023-5-3-sys
Резюме. Статията представя система, която илюстрира динамично наличието на набори от данни (datasets) и езикови модели в областта на изкуствения интелект в големи хранилища като Hugging Face. Целта на създаването на подобна система е да се покаже, че освен за английски език за всички останали официални европейски езици наборите от данни и езиковите модели, необходими за разработки, които се базират на или използват езикови технологии и изкуствен интелект, имат или средно добра, или фрагментарна поддръжка. Едновременно с това описанието на архитектурата на системата запознава читателите с удобни за използване инструменти като Node-RED, MariaDB и Grafana, които предоставят широки възможности за приложение при решаването на различни задачи, включващи обхождане и събиране на данни от интернет, съхранение на информация в база от данни и визуализация на данните по ясен и функционален начин. Всяка една от тези задачи, както и комбинацията им могат да се прилагат при изпълнението на ученически проекти в гимназиален етап на обучение.
Ключови думи: автоматично извличане на данни; визуализация на данни;
набори от езикови данни; езикови модели