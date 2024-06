Adnews Google Tradutor expande catálogo para 243 Idiomas

A atualização, possibilitada pela AI PaLM 2, abrange idiomas falados por 614 milhões de pessoas.

O Google Tradutor, serviço de tradução da gigante tecnológica, acaba de passar pela maior expansão de sua história, adicionando 110 novos idiomas ao seu catálogo. Antes desta atualização, o serviço suportava 133 idiomas, o que significa que o número de idiomas quase dobrou, chegando agora a um total de 243.

Essa expansão significativa foi viabilizada pelo modelo de linguagem AI PaLM 2, antecessor do Gemini, que desempenhou um papel crucial na aprendizagem desses novos idiomas. O engenheiro de software do Google, Isaac Caswell, destacou que o modelo foi particularmente eficaz em aprender idiomas relacionados entre si, como os próximos ao hindi (Awadhi e Marwadi) e os crioulos franceses (crioulo seichelense e crioulo mauriciano).

Entre os novos idiomas suportados, destaca-se o Cantonês, um dos idiomas mais solicitados pelos usuários do Google Tradutor. Caswell explicou que o Cantonês apresenta desafios únicos devido à sua sobreposição com o Mandarim na escrita, dificultando a obtenção de dados e o treinamento de modelos de linguagem.

A inclusão desses 110 novos idiomas amplia significativamente o alcance do Google Tradutor, abrangendo idiomas falados por mais de 614 milhões de pessoas, o que corresponde a cerca de 8% da população mundial. Essa expansão inclui tanto idiomas com milhões de falantes quanto línguas de pequenas comunidades indígenas e idiomas em processo de revitalização.

Entre os novos idiomas, destaca-se o Afar, falado em Djibouti, Eritreia e Etiópia, que contou com a maior contribuição voluntária da comunidade para sua inclusão. Outro destaque é o Manx, um idioma celta da Ilha de Man, que quase foi extinto em 1974, mas está sendo revitalizado com milhares de novos falantes. O N’Ko, uma forma padronizada das línguas mandingas da África Ocidental, com um alfabeto único inventado em 1949, também foi incluído. Além desses, há o Punjabi (Shahmukhi), variação do Punjabi escrito no script Perso-Árabe, sendo o idioma mais falado no Paquistão, e o Tamazight (Amazigh), um idioma berbere falado em toda a África do Norte, escrito nos alfabetos latino e Tifinagh. O Tok Pisin, um crioulo baseado no inglês e a língua franca da Papua Nova Guiné, completa a lista dos idiomas destacados.

