sexta-feira, 24 de julho de 2020

Pesquisa visual: tudo o que você precisa saber (até o momento)

A pesquisa visual é um dos setores mais complexos e ferozmente competitivos de nossa indústria. Aqui está uma análise dos principais participantes e o que a tecnologia deles nos permite fazer.

Autor
Clark Boyd
Data de publicação
5 de julho de 2017
Categorias
Indústria
Móvel
A pesquisa visual é um dos setores mais complexos e ferozmente competitivos de nossa indústria. No início deste mês, o Bing anunciou seu novo modo de busca visual, logo após desenvolvimentos semelhantes do Pinterest e do Google.

A nossa é uma cultura mediada por imagens, pelo que é lógico que a pesquisa visual assumiu tanta importância para as maiores empresas de tecnologia do mundo. O ritmo do progresso está certamente acelerando; mas não há um "vencedor" claro na pesquisa visual e nem haverá um em breve.

O setor de pesquisa se desenvolveu significativamente na última década, através de avanços na personalização, processamento de linguagem natural e resultados de multimídia. E, no entanto, alguém poderia argumentar que o poder da imagem permanece inexplorado.

Isso não se deve à falta de atenção ou investimento. Muito pelo contrário, de fato. Quebrar a pesquisa visual exigirá uma combinação de nous tecnológico, insight psicológico e conhecimento neurocientífico. Isso a torna uma área fascinante de desenvolvimento , mas também uma que não será dominada facilmente.

Portanto, neste artigo, começaremos com um esboço do setor de pesquisa visual e dos desafios que ele apresenta, antes de analisar o recente progresso feito pelo Google, Microsoft e Pinterest .

O que é pesquisa visual?
Todos participamos da pesquisa visual todos os dias. Sempre que precisamos localizar nossas chaves em vários outros itens, por exemplo, nossos cérebros estão envolvidos em uma pesquisa visual.

Aprendemos a reconhecer certos alvos e podemos localizá-los em um cenário movimentado com crescente facilidade ao longo do tempo.

Esta é uma tarefa mais complicada para um computador, no entanto.

A pesquisa de imagens, na qual um mecanismo de pesquisa realiza uma consulta com base em texto e tenta encontrar a melhor correspondência visual, é sutilmente distinta da pesquisa visual moderna. A pesquisa visual pode levar uma imagem como sua 'consulta', em vez de texto. Para realizar uma pesquisa visual precisa, os mecanismos de pesquisa exigem processos muito mais sofisticados do que na pesquisa tradicional de imagens.

Normalmente, como parte desse processo, redes neurais profundas são testadas em testes como o abaixo, com a esperança de que eles imitem o funcionamento do cérebro humano na identificação de alvos:



Recursos
Desenvolvimento Melhorando o relacionamento com SEO e desenvolvedor
Analytics Como fazer a análise online do concorrente
SEO SEO para redesenho e migração de sites
GoalPosts em constante mudança do Google Analytics - desafios de SEO e como superá-los
As decisões (ou "vieses" inerentes, como são conhecidas) que nos permitem entender esses padrões são mais difíceis de integrar em uma máquina. Ao processar uma imagem, uma máquina deve priorizar forma, cor ou tamanho? Como uma pessoa faz isso? Será que sabemos ao certo ou sabemos apenas a saída?

Como tal, os mecanismos de pesquisa ainda lutam para processar imagens da maneira que esperamos. Simplesmente não entendemos bem nossos próprios vieses para poder reproduzi-los em outro sistema.

Houve muito progresso neste campo, no entanto. A pesquisa de imagens do Google melhorou drasticamente em resposta a consultas de texto e outras opções, como o Tineye, também nos permitem usar a pesquisa reversa de imagens. Esse é um recurso útil, mas seus limites são evidentes.

Durante anos, o Facebook conseguiu identificar indivíduos em fotos, da mesma forma que uma pessoa reconheceria imediatamente o rosto de um amigo. Este exemplo é uma aproximação mais próxima do Santo Graal para busca visual; no entanto, ainda fica aquém. Nesse caso, o Facebook criou suas redes para procurar rostos, dando a eles um alvo claro.

No auge, a pesquisa visual online nos permite usar uma imagem como entrada e receber outra imagem relacionada como saída. Isso significaria que poderíamos tirar uma foto com o smartphone de uma cadeira, por exemplo, e fazer com que a tecnologia retornasse fotos de tapetes adequados para acompanhar o estilo da cadeira.

O processo tipicamente "humano" no meio, onde decifraríamos as partes componentes de uma imagem e decidiríamos sobre o que se trata, depois conceituar e categorizar itens relacionados, é realizado por redes neurais profundas. Essas redes são "não supervisionadas", o que significa que não há intervenção humana, pois elas alteram seu funcionamento com base em sinais de feedback e trabalham para fornecer a saída desejada.

O resultado pode ser fascinante, como nas interpretações abaixo de uma imagem de "Uma tarde de domingo na ilha de La Grand Jatte", de Georges Seurat, pelas redes neurais do Google :



Esta é apenas uma abordagem para responder a uma pergunta delicada, no entanto.

Não há respostas certas ou erradas nesse campo como está; simplesmente os mais ou menos eficazes em um determinado contexto.

Portanto, devemos avaliar o progresso de alguns gigantes da tecnologia para observar os avanços significativos que eles fizeram até agora, mas também os obstáculos a serem superados antes que a pesquisa visual seja realmente dominada.

Pesquisa visual do Bing
No início de junho, no TechCrunch 50, a Microsoft anunciou  que agora permitiria aos usuários "pesquisar por imagem".



Isso é notável por vários motivos. Primeiro de tudo, embora a pesquisa de imagens do Bing esteja presente há algum tempo, a Microsoft realmente removeu seu produto de pesquisa visual original em 2012. As pessoas simplesmente não a usavam desde o lançamento de 2009, pois não eram precisas o suficiente.

Além disso, seria justo dizer que a Microsoft está um pouco atrasada nesta corrida. Motores de busca rivais e plataformas de mídia social fornecem funções de busca visual há algum tempo.

Como resultado, parece razoável supor que a Microsoft deve ter algo atraente se optou por entrar novamente na briga com um anúncio público. Embora não seja muito revolucionária, a nova pesquisa visual do Bing ainda é uma ferramenta útil que se baseia significativamente no produto de pesquisa de imagens.



Uma pesquisa no Bing por “idéias de decoração de cozinha”, que mostra os novos recursos de pesquisa visual do Bing

O que diferencia a pesquisa visual do Bing é a capacidade de pesquisar em imagens e expandi-la para objetos relacionados que podem complementar a seleção do usuário.



 Um usuário pode selecionar objetos específicos, aprimorar-se neles e comprar itens semelhantes, se desejar. As oportunidades para os varejistas são óbvias e abundantes.

Vale ressaltar que a pesquisa visual do Pinterest já faz isso há algum tempo . Mas a diferença importante entre a capacidade do Pinterest e a do Bing nesse sentido é que o Pinterest só pode redirecionar usuários para Pins que as empresas disponibilizaram no Pinterest - e nem todos eles podem ser comprados . O Bing, por outro lado, pode indexar o site de um varejista e usar a pesquisa visual para direcionar o usuário a ele, sem nenhum esforço extra necessário por parte de qualquer das partes.

Alimentado pela tecnologia Silverlight, isso deve levar a uma abordagem muito mais refinada para pesquisar imagens. A Microsoft forneceu a seguinte visualização de como o sistema de processamento de consultas funciona para este produto:

Nenhum comentário:

Postar um comentário

Leilão de Imóveis: Como Funciona, Vantagens, Riscos e Dicas para Participar

Leilão de Imóveis: Como Funciona, Vantagens, Riscos e Dicas para Participar O leilão de imóveis é uma forma alternativa de compra e venda ...