Google Translate вече може да превежда и от ромски език (ВИДЕО)

Google Translate вече може да превежда и от ромски език (ВИДЕО)

Преводачът на Google разшири базата си данни с още 110 нови езика

 

AI помага на Google Translate да се разшири със 110 нови езика, което е най-голямата му актуализация досега.

Google обяви в публикация в блог, че това огромно разширяване включва езици, говорени от над 614 милиона души по света, или около 8% от световното население. Разнообразието е огромно - от езиците, говорени от повече от 100 милиона души, до ценни диалекти на местните общности.

Включени са дори езици без текуща националност, което демонстрира ангажимента на Google за запазване на застрашените езици.

В допълнение към тази впечатляваща актуализация, Google се фокусира върху африканските езици, които представляват около една четвърт от новите допълнения. Езици като „фон“, „киконго“, „лу“, „га“, „суати“, „венда“ и уолоф вече са част от Google Translate, отбелязвайки най-значимия напредък в добавянето на африканските езици досега.

Google признава, че преводът на езици не е лесен поради регионални вариации, диалекти и разлики в правописа. Някои езици, като ромския, с неговите много диалекти, нямат една стандартна форма, което прави превода сложен.

Снимка: Google Translate/iStock

Големият езиков модел PalM 2 на Google беше полезен при разширяването на Translate. Той научава сродни езици, което позволява добавянето на подобни на хинди езици като авадхи и марвади, както и френски креолски езици като сейшелски и мавритански.

Добавянето на широко използвани езици като кантонски идва със собствени предизвикателства поради споделените писмени знаци с мандарин. Въпреки тези пречки ангажиментът на Google към езиковото многообразие е ясен. Пример е включването на мански, келтски език от остров Ман, който почти изчезна през 1974 г. Благодарение на усилията за съживяване, броят на говорещите свободно нарасна до хиляди.

Снимка: Ладислав Цветков

Това разширение включва и пенджаби, написан на шрифта Shahmukhi, персийско-арабски вариант, използван в Пакистан, където е най-разпространеният език.

Преди това разширение най-голямата актуализация на Google Translate беше през май 2022 г. с въвеждането на Zero-Shot машинен превод. Тази технология позволява на модела да учи нови езици, без да има нужда от съществуващи преведени примери. Това беше голям напредък в машинния превод, който помогна на Google да преодолее допълнително езиковите бариери.

Снимка: Ладислав Цветков

Това разширение е голяма стъпка към инициативата на Google за 1000 езика, която има за цел да използва модели на изкуствен интелект за поддръжка на 1000 от най-важните езици в света.

Последни публикации

Бизнес Видео Подкаст