Using ngrams for better search results#213
Conversation
|
Das Konzept gefällt mir. Aber Text unter 5 Wörter liefern damit leeren Query zurück. Query darf insgesamt vermutlich auch nicht zu lang werden. Der Code für queries liegt momentan auch nicht ordentlich strukturiert vor:
Bevor das also reinkommt, würde ich da 1. noch Tests haben und |
Implemented fallback to always return some text Implemented a text limit
|
Gutes Feedback, Danke! Die Queries finde ich einen guten Punkt. Ich würde zudem mehrere Selektoren pro Site zulassen, um sowohl Headline als auch Teaser suchen zu können. Zu den Sonderzeichen: Hast du dafür Beispiele? Wenn die Guillemets schwierig sind, werden sonstige Sonderzeichen wahrscheinlich auch schwierig, oder? |
Fehler bei der Wörterlänge behoben
|
Bei zeit.de ist mir noch ein Problem aufgefallen: Mit dem neuen Code wird dort eine leere Query an Genios übermittelt, mir ist aber nicht klar, warum. |
Like in #212 descriped