No mais recente encontro da Sociedade Brasileira da Computação (SBC), em Belém-PA, uma pequena delegação feminina de googlers esteve presente para apresentar uma proposta inspiradora para o universo de mulheres da computação. Durante o encontro, foi anunciado um prêmio parar mulheres que estudam ciência da computação de engenharias.
A engenheira de software, Alice Bonhomme-Biais, do Google em Nova York, falou na manhã de terça-feira, 15 de julho, aos presentes do congresso sobre os desafios de trabalhar com uma ferramenta de busca comercial e, ao lado de Patricia Prieto, gerente de captação de talentos do Google para América Latina, anunciou o prêmio Google Brazil Women in Technology.
As inscrições poderão ser feitas entre os dias 21 de julho e 8 de setembro no site http://www.google.com/jobs/brazilwomen por mulheres de todo o país que estejam cursando graduação, mestrado ou doutorado em áreas ligadas à computação. Dez estudantes serão premiadas com laptops e visita ao escritório de engenharia do Google em Belo Horizonte (MG).
Patrícia Prieto, que estava lá em Belém, disse que foi muito boa a receptividade de todos em relação ao prêmio. “Professoras das universidades que participavam do Congresso nos parabenizaram pela iniciativa. Esperamos inspirar muitas mulheres que estão cursando essas áreas a não desistirem”, comentou.
O crescimento do chamado conteúdo gerado pelo usuário, da criatividade e da expressão individual na Internet é fenomenal. Os fatos falam por si: um blog é criado a cada segundo todos os dias; 13 horas de vídeo são colocados no YouTube, o maior site do mundo de compartilhamento de vídeos, a cada minuto; e mais de 25% dos internautas, cerca de 1 bilhão de pessoas, fazem parte de uma rede social – seja ela o Facebook nos Estados Unidos, o Bebo na Grã-Bretanha ou o Orkut aqui no Brasil.Os benefícios dessa nova maneira de se comunicar são enormes. Milhões de pessoas em todo o mundo têm uma liberdade sem precedentes – liberdade para criar e comunicar-se, para organizar e influenciar, para falar e ser ouvido. Isso também ajuda a sociedade com um todo, pois quando as pessoas têm maior acesso à informação e exposição às opiniões de outros indivíduos, normalmente elas tomam decisões melhores.No entanto, infelizmente nem todos utilizam a Internet como algo para o bem. Algumas vezes é uma questão de opinião, ou mesmo uma tradição local. Armas, por exemplo, são mais aceitáveis em algumas sociedades do que em outras. E a maneira como países diferentes lidam com o racismo e incentivo ao ódio varia de forma imensa. Na Alemanha, por razões históricas óbvias, é ilegal promover o Nazismo. Em outros casos, fica óbvio que o material deve ser removido e as pessoas que o vendem devem ser processadas e punidas. Por isso, empresas como Google enfrentam desafios concretos, não só porque operam em mais de 100 países, mas também porque a forma como as pessoas utilizam nossa tecnologia evolui quase que diariamente. Nós tentamos constantemente estar um passo à frente dos criminosos que abusam de nossos serviços, e estamos sempre nos certificando de que haja um equilíbrio correto entre o direito de um indivíduo de se expressar e as opiniões de uma comunidade mais ampla. É por essa razão que, no Brasil, nós estamos trabalhando fortemente com o governo e as autoridades locais para pôr em prática novas formas de proteção ao usuário. Nossa missão é procurar garantir que o Orkut não seja utilizado para atividades criminosas. Pedimos aos nossos engenheiros que estudassem como a tecnologia pode ajudar a evitar os abusos e possibilitar que promotores do Estado rastreiem os criminosos quando algum ato ilícito ocorrer. Nós queremos manter a integridade do Orkut para que milhões de brasileiros que amam o site possam continuar a utilizá-lo de forma segura e para o bem.
No geral, nós só mantemos informações sobre os "posts" no Orkut (incluindo o endereço do computador a partir do qual eles foram gerados) por 30 dias. Mas os promotores brasileiros estão convencidos de que esse tempo não é longo o suficiente para os casos suspeitos de má conduta. Assim, nós concordamos em manter os registros dos usuários brasileiros do Orkut por seis meses, o que dará às autoridades o tempo hábil que eles necessitam para coletar evidências e, se necessário, processar os responsáveis.
Nós também cumprimos nossa promessa feita diante do Senado Federal para desenvolver meios mais efetivos para fornecer as informações solicitadas pelas autoridades, de forma que possamos enviá-las aos promotores brasileiros o mais rápido possível.
Além disso, nós estamos trabalhando com a SaferNet – uma importante organização de proteção à criança – para ver como podemos trabalhar em parceria para evitar a disseminação de material nocivo. Juntos, desenvolvemos um sistema de aviso que possibilitará que a SaferNet nos alerte sobre uma suspeita de conteúdo ilegal quando ela aparecer. Uma equipe especial do Google verificará então a evidência fornecida e responderá à SaferNet, que poderá alertar o Ministério Público Federal. Nós acreditamos que isso ajudará a remover material ilegal mais rapidamente e possibilitará que os promotores busquem ordens judiciais para que os responsáveis possam ser identificados.
Ajudar as autoridades a rastrear e processar os responsáveis por esses crimes é importante, mas a prevenção é melhor do que a cura. Por isso, o Google vem trabalhando com afinco nos últimos dois anos para desenvolver novas ferramentas que ajudem a evitar que material ilegal seja colocado no Orkut. Essas inovações nos permitirão identificar e remover imagens inadequadas com mais eficiência – e a dissuadir outros a fazê-lo.
Obviamente, nenhum sistema é à prova de erros. Mas eu acredito que as mudanças que colocamos em prática ajudarão a combater o crime, ao mesmo tempo em que protegerão a liberdade de expressão da imensa maioria dos usuários do Orkut no Brasil – uma parcela que segue a lei e usa o Orkut para o bem.
Lidar com conteúdo controverso é um dos maiores desafios que enfrentamos como empresa. Nós sabemos que não temos todas as respostas. Também sei que no Brasil, como em muitos outros países, nós não temos um índice de 100% de acerto. No entanto, tentamos ser o mais transparente possível sobre a forma como tomamos decisões. E assumimos o compromisso de sempre manter os usuários do Orkut informados e envolvidos, trabalhar com as autoridades locais e aprimorar nossos atos e políticas.
Em maio, Udi Manber apresentou nosso grupo de qualidade de busca responsável pela classificação dos resultados das consultas. Naquele post, Ubi apresentou várias equipes dentro da “Qualidade” (como gostamos de chamar o grupo), incluindo Classificação Principal, Busca Internacional, Interfaces com o Usuário, Avaliação, Webspam e outras equipes. Hoje eu gostaria de falar mais sobre uma daquelas equipes: A equipe de Classificação Principal.
Meu nome é Amit Singhal. Sou o Google Fellow encarregado da equipe de busca do Google. Trabalhei na área de busca nos últimos 18 anos tendo sido apresentado à busca em 1990 como estudante de pos graduação em ciência da computação. No mundo acadêmico, a área de busca é conhecida como Recuperação de Informação (ou RI). Após passar uma década como pesquisador de RI, vim para o Google em 2000 e trabalho com a busca desde então.
A busca do Google é um conjunto de algoritmos usados para encontrar os documentos mais relevantes para a consulta de um usuário. Fazemos isso em centenas de milhões de consultas por dia, a partir de um conjunto de bilhões e bilhões de páginas. Esses algoritmos são executados para cada consulta realizada na maioria dos serviços de busca do Google. Enquanto a busca de páginas Web é o nosso serviço mais usado e mais conhecido, os mesmos algoritmos também são usados - com algumas modificações - para outros serviços de busca do Google, incluindo Imagens, Notícias, YouTube, Mapas, Pesquisa de Produtos, Pesquisa de Livros e outros.
A pergunta mais comum que ouço sobre a classificação do Google é “como é que vocês fazem?". Obviamente, existem várias coisas que ajudam a criar um sistema de classificação tão moderno como o nosso e eu me aprofundarei na tecnologia por trás dele em um outro post. Hoje gostaria de compartilhar brevemente as filosofias por trás do processo de classificação do Google:
1) os resultados mais relevantes localmente servidos globalmente
2) manter a simplicidade
3) sem intervenção manual
A primeira filosofia é óbvia. Por causa de nossa paixão pela busca, queremos ter absoluta certeza de que todas as consultas dos usuários obtenham os resultados mais relevantes. Freqüentemente chamamos esse princípio de “nenhuma consulta será abandonada”. Sempre que fornecemos resultados inferiores ao ideal para qualquer consulta em qualquer idioma, em qualquer país - e o fazemos (busca não é de forma alguma um problema resolvido) - usamos isso como inspiração para melhorias futuras.
O segundo princípio também parece óbvio. Não é o desejo de todo arquiteto de sistema manter seus sistemas simples? Bem, conforme os sistemas de busca avançam, dada a grande variedade de consultas de usuários que precisamos responder em vários idiomas, é comum querer adicionar mais complexidade ao sistema para servir a fração incremental seguinte das consultas. Trabalhamos muito para que nosso sistema se mantenha simples sem comprometer a qualidade dos resultados. Esse é um esforço constante que vale à pena. Fazemos cerca de dez alterações de classificação toda semana e o grande fator considerado é a simplicidade na implementação de cada mudança. Nossos engenheiros entendem exatamente porque uma página foi classificada de certa maneira para uma dada consulta. Esse sistema simples e compreensível nos permitiu inovações rápidas, o que é visível! A filosofia de “manter a simplicidade” nos serve muito bem.
Nenhuma discussão sobre a classificação do Google seria completa sem que se fizesse a comum - porém equivocada! :) - pergunta: “O Google edita manualmente seus resultados?” Vou responder a essa pergunta usando a nossa terceira filosofia: "sem intervenção manual". No nosso ponto de vista, a Internet é feita por pessoas. Vocês são as pessoas que criam páginas e links para as páginas. Estamos usando toda essa contribuição humana através de nossos algoritmos. A ordenação final dos resultados é decidida por nossos algoritmos usando as contribuições da comunidade maior da Internet e não manualmente por nós. Acreditamos que o julgamento subjetivo de qualquer indivíduo é... bem... subjetivo, e as informações filtradas por nossos algoritmos do vasto volume de conhecimento humano codificado nas páginas da Internet e seus links é melhor do que a subjetividade individual.
A segunda razão pela qual temos um princípio contra o ajuste manual de nossos resultados é que, freqüentemente, uma consulta com resultados ruins é apenas um sintoma de uma melhoria em potencial a ser feita ao nosso algoritmo de classificação. Melhorar o algoritmo fundamental não apenas melhora aquela consulta, melhora toda uma classe de consultas e, na maioria das vezes, para todos os idiomas. Devo acrescentar, entretanto, que existem políticas claras para sites recomendados pelo Google e nós tomamos as devidas providências contra sites que, por quaisquer motivos, violam nossas políticas (ex.: exigências legais, pornografia infantil, vírus, malware, etc.).
Fique ligado no meu próximo post em que discutirei em detalhes as tecnologias por trás de nossa classificação e darei exemplos de várias técnicas modernas de classificação em ação. Nossa paixão pela busca está mais forte do que nunca, e devo dizer que, como um pesquisador de busca, tenho o melhor emprego do mundo. :-)