Искате да опознаете BgGPT — семейството български езикови модели? По-долу обобщаваме, към юни 2026 г. Смисълът не е „да победи големите американски модели“, а силата на български език и възможността данните да останат в ЕС.
Какво е BgGPT
семейство български езикови модели на INSAIT (звено на Софийския университет); BgGPT 3.0 (на база Gemma 3, 4B/12B/27B, мултимодален) — претенцията е „най-добро качество на български на параметър“ (твърдение по бенчмаркове за български), НЕ че бие GPT/Gemini; правителствени внедрявания (НАП, Сметна палата) [да се провери] на собствена инфраструктура Разработва се от INSAIT — звено на Софийския университет „Св. Климент Охридски“. Най-новото поколение BgGPT 3.0 е на база Gemma 3 (4B/12B/27B, мултимодален) и е с отворени тегла под лиценза Gemma (по-старите версии v0.1/v0.2 на база Mistral бяха Apache 2.0). Има безплатно публично чат приложение chat.bggpt.ai (iOS/Android).
Предимства и недостатъци
Предимства
- Фокус върху българския език с безплатно чат приложение (chat.bggpt.ai)
- Отворени тегла (под лиценза Gemma), така че моделите може да се хостват и самостоятелно
- Българско езиково усилие — принос към местната екосистема, с правителствени внедрявания (НАП, Сметна палата) на собствена инфраструктура
[да се провери]
Недостатъци
- Защитимата претенция е „най-добро качество на български на параметър“ — твърдение по бенчмаркове за български, НЕ че бие GPT/Gemini
- Не е флагман от челен ред — при общите задачи на английски големите американски модели обикновено са по-силни
- Лицензът Gemma не е OSI/Apache — проверете условията на модела преди търговска употреба
За кого е подходящ?
Ясен избор, ако за вас е важна силата на български език или ако искате с отворен модел да задържите данните в ЕС. Българските и европейските AI модели — BgGPT (на INSAIT, звено на Софийския университет „Св. Климент Охридски“; адаптиран български езиков модел с отворени тегла под лиценза Gemma за поколението на база Gemma — по-старите версии v0.1/v0.2 на база Mistral бяха Apache 2.0; безплатно чат приложение chat.bggpt.ai), пан-европейският OpenEuroLLM и ЕС-суверенният Mistral — са ценни преди всичко като BYO-модел слой, като качество на български език и като възможност данните да останат в ЕС. Това не означава, че надминават големите американски модели — няма „български ChatGPT“, който да ги бие. Защитимата претенция на BgGPT е най-добро качество на български на параметър (твърдение, основано на бенчмаркове за български, не независим факт), не обща производителност. Бенчмарковете на разработчиците са твърдения, не независими факти.
Къде се съхраняват данните ми? Доставчик с американска компания-майка може да попада под американския CLOUD Act, така че властите в САЩ могат да поискат достъп до данните дори когато те са в ЕС. Данните могат да останат в ЕС — в България обаче няма собствен регион на големите облачни доставчици; най-близките са Франкфурт (AWS eu-central-1) и Варшава (Azure/GCP), и двата в ЕС. За повече контрол: изберете ЕС регион, хоствайте сами в собствения си акаунт, пускайте локално или използвайте европейски/отворен модел.
Ако контролът върху данните ви е важен, решение може да е BYO-модел платформа, която можете да хоствате сами, като osFoundry, защото данните ви остават в собствения ви акаунт или дори локално
Прочетете също
Тази статия е обща информация, не правен или данъчен съвет.