Skip to content


Planer inför en gigantisk databas med meningar

Tidigt iår började jag planera upp ett nytt litet projekt. Det rörde sig i stora drag om att bygga upp en gigantisk kombinerad databas med ord, meningar, synonymer och annat nyttigt som kan vara bra att ha då man vill manipulera och förvränga text i syfte att underlätta skapandet av unik artikel.

Hittils har jag importerat in en thesaurus på 24 megabyte i in i en databas. Vidare har jag en lista över stop-ord samt en databas över verb. Det är en bra början som efter lite experimenterande i enkla PHP-skripts visade hur effektivt det kan vara att ha tillgång till sådana databaser, inte bara i att skapa unik artikel från noll utan även i att förädla unikt innehåll.

Nästa projekt kommer att bli att spindla textmaterial samt sanitera och klassa upp meningar i olika meningslängder innan de stoppas in i en meningsdatabas. Jag tänker mig att meningar kommer vara klassade efter hur långa de är och kanske även i vilket nisch meningen tillhör.

Så vad kan man då göra om man har en databas med 10 miljoner meningar i?

Tänk dig att du har en applikation, ett formulär där du skriver en artikel i. Du kan högerklicka på ord och enkelt välja liknande eller andra ord. Men du kan även högerklicka över meningar och via Ajax få upp en lista på meningar som liknar den mening man högerklickat listat uppifrån och ner med den mest relevanta meningen högst upp. Naturligtvis kommer nyckelorden inte stämma, men om man låter ett skript analysera meningarna och hitta nyckelord själva så kanske man kan hitta en lösning där med.

Relaterade inlägg

Posted in Egna webprojekt, SEO.

Tagged with , , .


0 Responses

Stay in touch with the conversation, subscribe to the RSS feed for comments on this post.



Some HTML is OK

or, reply to this post via trackback.


Blogg listad p Bloggtoppen.se
Blogg Topplista
Top Internet bloggar