O Blog do Google Brasil
Novidades sobre os produtos e a tecnologia do Google no Brasil e no mundo
Reconhecimento da voz no Google: ensinando o seu telefone a falar e a ouvir
23 fevereiro, 2011
Esta é a postagem mais recente na nossa
série
(link em inglês) de perfis de empreendedores Googlers que trabalham em produtos na empresa e ao redor do mundo. Desta vez, você conhecerá os bastidores da construção, por um Googler, da equipe que desenvolveu a tecnologia de reconhecimento de voz por trás de produtos, como as transcrições do YouTube e a pesquisa por voz. - Editor
Quando consegui minha primeira entrevista no Google, em 2004, o celular estava começando a se tornar importante para a empresa. A minha paixão era a tecnologia de reconhecimento da fala, setor em que trabalhei por vinte anos. Depois de dez anos de pesquisa sobre reconhecimento de voz na SRI, seguidos de mais dez anos construindo a Nuance Communications, empresa que cofundei em 1994, estava pronto para um novo desafio. Sentia que os celulares estavam no momento ideal para inovações e destinados a ser uma plataforma importante na distribuição de serviços. E havia a necessidade de desenvolver a tecnologia de reconhecimento de voz.
Na minha entrevista, falei sobre o meu desejo de atuar na área de celulares. E que se o Google não tivesse grandes planos para celulares, então eu não me encaixaria na empresa. Bem, consegui o emprego e comecei logo depois, sem uma equipe e nem uma função bem definida. Ao clássico estilo Google, fui encorajado a explorar a empresa, a conhecer o trabalho das várias equipes e a descobrir onde precisavam de mim.
Depois de alguns meses, apresentei à direção a ideia de criar uma interface de voz baseada no telefone para a pesquisa local. Apesar de haver várias opiniões sobre quais aplicações eram mais adequadas ao Google, todos na reunião concordaram que eu deveria montar uma equipe centralizada na tecnologia de reconhecimento de voz. Com a ajuda de dois colegas que também tinham experiências com o reconhecimento de voz, comecei o recrutamento. Em poucos meses, estávamos criando o nosso próprio sistema de reconhecimento de voz.
Seis anos depois, estou empolgado com o caminho que já percorremos, o que, por sua vez, ampliou nossas metas a longo prazo. Quando comecei, eu tinha que convencer as outras equipes sobre o valor da tecnologia de reconhecimento de voz para os objetivos do Google. Agora, as outras equipes diariamente me trazem ideias e novas demandas para o reconhecimento de voz. O maior desafio é dimensionar o nosso trabalho para atender às oportunidades. Avançamos desde o GOOG-411, nosso primeiro serviço baseado no reconhecimento de voz, para a
Pesquisa por voz
, Entrada de voz (site em inglês),
Ações por voz
(site em inglês), uma
API de voz
(site em inglês) para desenvolvedores Android,
legendagem automática de vídeos do YouTube
(site em inglês),
transcrição automática de correio de voz para o Google Voice
(site em inglês) e
tradução de fala para fala
(site em inglês), entre outros. Apenas no ano passado, convertemos nossa tecnologia para mais de vinte idiomas.
A tecnologia de reconhecimento de voz requer uma enorme quantidade de dados para abastecer nossos modelos estatísticos e muito poder de processamento para treinar nossos sistemas. O Google é o lugar ideal para se ir atrás de abordagens técnicas como essa. Com grandes quantidades de dados, poder de processamento e uma infraestrutura centrada no suporte de serviços em grande escala, somos motivados a lançar novos produtos rapidamente e a refazer tudo com base no feedback em tempo real.
Tenho explorado a tecnologia do reconhecimento de voz por quase três décadas, mas ainda assim enxergo grande potencial para mais inovações. A nossa visão é de uma interface para a comunicação por voz e texto que derrube todas as barreiras dos sentidos e do idioma, para fazer com que a informação seja verdadeiramente de acesso universal. E acho que é aqui no Google que temos a melhor oportunidade de fazer desse futuro uma realidade.
Atualização
: O título desta postagem não é tão adequado. A tecnologia de reconhecimento de voz não é usada somente em celulares, mas também em tarefas como transcrição de vídeos do YouTube e de correio de voz.
Postado por: Mike Cohen, Gerente, Tecnologia de Voz
Categorias
#carnaval
#copabr
#DáUmGoogle #YearinSearch #YearinSearchBrasil
#gddbr
#gonegoogle
#GoogleArts&Culture #Vermeer
#googleatrio20
#GoogleforBrazil
#hangoutsdenatal
#hangoutSPFW
#MaesCriadoras
#marcocivil
#ViladoPapaiNoel
+1
10 anos de Chrome; Chrome; Novo Chrome
10 anos de Google
20 anos de Google
20 anos do Google; Google 20 anos; Google; Aniversário do Google
admin
AdMob
adsense
adwords
AI
ajuda
Amazon
amazonas
Amazônia
America Latina
América Latina
Android
Android Go
aniversário
aplicativo
apps
art project
arte urbana
arte urbana contemporânea
artificial intelligence
artistas
Bach
blogger
bolsa
brazil elections
busca
busca 2017
busca do ano
buzz
caffeine
Campus São Paulo
Carnaval
celular
ceu
Change the Game
China
chrome
chromebook
chuvas
Cidadania Digital
cinejoia
cloud computing
colorpluscity
compartilhamento
comunidades
conecte
Conta do Google
conversas agrupadas
copa do mundo
COVID19
Creators for Change
Cresça com o Google
CriandoOrgulho
Cultural Institute
cultural institute; berlim; muro
currents
curso
dados móveis
data center
datally
desenvolvedores
design
detona ralph
Developer Bus
developer day
Dia da Internet Segura
dia da privacidade de dados; privacidade
Dia Internacional da Mulher
doação
docs
Doodle
doodle4google
drive
Earth
Ecad
educação
elections
eleições
email
empreendedor
férias
fifa
Files
filmes
FLIP
Frida Kahlo Google Arts & Culture
gdd
geo
gmail
GNI
Google
Google Allo
google apps
Google Apps para empresas
Google Arts & Culture
Google Assistente
Google Business Internship
Google Cloud
Google Docs
google earth
google earth solidário
Google Earth Timelapse
google for education
google green
google io
google mapas
google maps
Google news
google notícias
google pay
Google Play
Google Press Summit
Google Science Fair
Google translator
Google Trends; Eleições; Eleições 2018
google trips
google.org
Google+
gps
graffiti
Grand Canyon
hackathon
hangouts
hiroshima
histórico
horário de pico
IA
IE8
impacto econômico
índice
inteligência artificial
International Women's Day
internet
internet aberta
iphone
jardim zoológico
jornalismo
labs
LARA
LARA 2019
Latin America Research Awards
Latitude
leilão
lemann
liberdade
liberdade de expressão
livros
localização
machine learning
mãe
mapas
maps
marimoon
musica
My Account
nagasaki
natal
navegador
NBU
negócio
neutralidade de rede
next billion users
NextUp
notícia
nova escola
novo
oceano
offline
onebox
orkut
orquestra sinfônica
pagamento
painel do conhecimento
pesquisa
pesquisa 2017
pesquisa de lugar
pesquisa do ano
pesquisa por voz
places
Playtime
pré-visualizações
Primer
privacidade
produtividade
Programa Proteção Avançada
rafael cortez
retrospectiva
revista veja
Rewind
rio
Safer Internet Day
Search
segurança
serviços geoespaciais
Sketchup
street view
surui
tecnologia na escola
termos de serviço
thinkinfinite
Timelapse
traductor
tradutor
Transparency Report
treinamentos
trips
tv
universidades
viagem
Video
voice search
voz
wallace and gromit
WAN-IFRA
WAP
waze
web analytics
web store
webmaster
webmasters
windows
year in search
YouTube
YouTube Coachella
YouTube Go
YouTube Kids
YouTube NextUp
YouTube Space
YouTube Space Rio
YouTube symphony
zeca baleiro
zeitgeist 2011
zeitgeist 2012
Arquivo
2022
fev.
jan.
2021
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2020
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2019
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2018
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2017
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2016
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2015
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2014
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2013
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2012
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2011
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2010
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2009
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
2008
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2007
dez.
nov.
out.
set.
ago.
jul.
jun.
mai.
abr.
mar.
fev.
jan.
2006
dez.
nov.
out.
set.
ago.
jul.
Feed
Follow @googlebrasil