Olá,
tenho que seguinte situação, temos um comparador de preços, os produtos vem de lojas. Um produto pode vir com nomes diferentes.
Exemplo: Notebook apple macbook 15 , esse produto pode vir das lojas com nomes diferentes:
NB apple mac-book 15
notebook apple macbook 15
apple notebook mac-book 15
...assim por diante... podendo ter variações dos nomes entre lojas diferentes.
Pergunto: como posso fazer isso? Quando procurar por exemplo: Notebook apple macbook 15 ele mostrar 'esse produto esta em 5 lojas diferentes'. Ele teria que procurar semelhanças entre os nomes dos produtos e eleger quais são os semelhantes.
Como posso fazer isso sem que seja um trabalho manual?
Att.
Produtos Com Nomes Similares
Started By t0th, 12/04/2012, 16:21
1 reply to this topic
#1
Posted 12/04/2012, 16:21
#2
Posted 03/05/2012, 10:55
Algumas sugestões:
- Usar busca textual (Full-text Index):
Isto pode te trazer vários benefícios, mas provavelmente você vai precisar fazer algumas alterações na sua estrutura de dados para adequar-se, também será necessário alterar alguns procedimentos de gravação nessa nova estrutura, consequentemente, na pesquisa.
- Usar técnicas como normalização , tokenização e anti-phrase:
Remover todos os caracteres especiais, substituir caracteres acentuados por não acentuados, palavras desnecessárias, entre outros;
- Usar algoritmos fonéticos e/ou probabilísticos:
Soundex, Fuzzy, Levenshtein, etc. Dependendo da linguagem utilizada, já possuem implementações ou bibliotecas prontas;
- Usar busca textual (Full-text Index):
Isto pode te trazer vários benefícios, mas provavelmente você vai precisar fazer algumas alterações na sua estrutura de dados para adequar-se, também será necessário alterar alguns procedimentos de gravação nessa nova estrutura, consequentemente, na pesquisa.
- Usar técnicas como normalização , tokenização e anti-phrase:
Remover todos os caracteres especiais, substituir caracteres acentuados por não acentuados, palavras desnecessárias, entre outros;
- Usar algoritmos fonéticos e/ou probabilísticos:
Soundex, Fuzzy, Levenshtein, etc. Dependendo da linguagem utilizada, já possuem implementações ou bibliotecas prontas;
------
Mero mortal!
Mero mortal!
1 user(s) are reading this topic
0 membro(s), 1 visitante(s) e 0 membros anônimo(s)