Op dit moment ontwikkel ik een reisinformatie website die zelf de content genegeerd om zo informatie te verschaffen over allerlei uithoeken op de wereld.
Hiervoor heb ik software ontwikkeld die geografische kaarten analyseert en er vervolgens een informatief "verhaal" van schrijft.
Ik vraag me af hoe Google hier mee om zal gaan? Zal Google detecteren of dat dit niet door mensen is geschreven of zou het voldoende "geavanceerd" zijn dat Google er niet achter zal komen. Kanttekening, de stukjes zijn écht informatief en op waarheid gebaseerd. Het is niet zo dat het pure onzin is om maar bezoekers te lokken. Het is informatie waar een reiziger wat mee kan.
De software werkt als volgt voor bijvoorbeeld een strand:
1. Het analyseert de omgeving van het strand: wat is de omtrek, waar ligt het, aan welk water ligt het, wat ligt er omheen, etc, etc.
2. Vervolgens haalt het uit een database van honderden zinnen een zin die het beste past bij het strand.
3. Daarna plaatst het bepaalde variabelen die in stap 1 zijn gevonden in de zin (zie de afbeeldingen).
4. Uiteindelijk doet het dat of 3 tot 8 keer en ontstaat er een verhaal.
Om het afwisselender te maken zijn er voor elke zin 5 of meer varianten. De software kiest op basis van een 'willekeurig' nummer een versie van een zin.
Het willekeurige nummer is afhankelijk van een input zodat de uitkomst van het nummer altijd hetzelfde is. Hierdoor blijft het verhaal constant en wijzigt het niet per bezoek. Als een verhaaltje bestaat uit 6 zinnen zijn er (6 5) 7.776 mogelijke verschillende mogelijkheden, waarna de variabelen het nog unieker maken.
Is dit geavanceerd genoeg om door Google gewaardeerd te worden? Ik weet dat Google content spinning snel door heeft, daar worden alleen synoniemen gebruikt. Dit gaat naar mijn idee een heel stuk verder. Het zou in principe door een mens geschreven kunnen zijn, alleen zouden bepaalde zinsdelen in andere verhalen, bij een ander strand, terug kunnen komen.
Dit is bijvoorbeeld een uitkomst waarbij de rode tekst variabelen zijn die sowieso voor elk strand anders zijn, de zinnen zelf zouden in andere teksten wel terug kunnen komen:
In het zuid-westen van Thailand ligt het strand Merlin Beach. Het strand ligt aan Andaman Zee drie kilometer van de plaats Patong. Het wordt omgeven door bossen en is onderdeel van het hotel Merlin Beach Resort waardoor de toegang beperkt kan zijn. Het water van de Andaman Zee heeft hier het hele jaar door een vrij constante temperatuur die rond de 29 ℃ schommelt.Ton Sai Beach is de naam van een behoorlijk groot strand in de gelijknamige baai Ton Sai Bay. Vanuit Ko Phi Phi Don gezien, een plaats in het zuid-westen van Thailand, ligt het strand ongeveer drie kilometer in zuidelijke richting aan de straat van Malakka.
- Computer gegenereerde content en Google
-
05-10-2015, 10:03 #1
- Berichten
- 1.410
- Lid sinds
- 16 Jaar
Computer gegenereerde content en Google
-
In de schijnwerper
Domeinnaam koopjeskelder: een betekenisvolle naam vanaf 99 euroDomein te koopVoetbalticketsduitsland (.nl) | 650 organische bezoekers in de afgelopen 3 maandenWebsite te koopwegens beëindiging bedrijf beschikbaar | HappyHuisdier.nl DA13 - DR16Website te koopGastartikelen plaatsen op échte websites met bezoekers en goede domeinwaarden?!SEO/Linkbuilding -
05-10-2015, 10:20 #2
- Berichten
- 1.490
- Lid sinds
- 10 Jaar
Re: Computer gegenereerde content en Google
Maakt geen bal uit voor Google. Ik zie genoeg gespinde crapteksten goed ranken. Teksten die gemaakt zijn met tools die bij lange na niet zo geavanceerd zijn als die van jou lijkt te zijn.
-
05-10-2015, 10:37 #3
- Berichten
- 1.410
- Lid sinds
- 16 Jaar
Re: Computer gegenereerde content en Google
Dat klinkt hoopgevend. Het is een van de puntjes waar ik namelijk onzeker door was.
Het idee is om zo bizar veel informatie te hebben dat de website op allerlei zoekwoorden in de resultaten komt en daardoor verkeer trekt.
-
05-10-2015, 11:06 #4
- Berichten
- 5.670
- Lid sinds
- 18 Jaar
Re: Computer gegenereerde content en Google
Als je op grond van de harde data al heel veel specifieke en diverse informatie kunt aanreiken zou ik me er niet zo druk om maken. Sterker nog: je maakt er zinnen van om het prettig leesbaar te maken voor de bezoekers. Een dat is toch weer precies wat Google wil? Ik denk dat het daarom wel goed zit. Wat wel aan te raden is om te kijken of je ook variaties voor informatieve termen zoals "vrij constante temperatuur" kunt maken.
Momenteel ben ik bezig met een soortgelijk project in de automotive branche, waar de steeds unieke informatie van occasions middels een grote variatie aan tekstfragmenten tot leesbare zinnen (in voice-overs) wordt getransformeerd. Een variant van die teksten gaan we ook voor de omschrijvingen gebruiken. Een hele klus maar de eerste tests zijn veelbelovend.
Content spinning waarbij je dezelfde informatie en content steeds hergebruikt is inderdaad niet de bedoeling.
-
05-10-2015, 11:17 #5
- Berichten
- 1.410
- Lid sinds
- 16 Jaar
Re: Computer gegenereerde content en Google
Dat dacht ik ook.
In feite is het hetzelfde als dat je (in mijn geval) een reisleider een verhaal laat schrijven. Die baseert zich ook op feiten die hij heeft gezien in de omgeving.
Het nadeel, en dat zul jij dan ook hebben, is dat je met een beperkte bibliotheek "basis zinnen" werkt. Zoals je zegt vullen de harde feiten ~ 50% van de zinnen op waardoor het uniek wordt, maar toch blijft het altijd minder creatief als een menselijke schrijver.
Heb jij dan ook een oplossing gevonden om over termen als "mooie, beschadigde, in de kreukels liggende, prachtige, puntgave" - auto te schrijven? Want dat is toch iets wat niet uit harde data af te leiden valt. Of heb je het daar verder niet over?
-
05-10-2015, 11:45 #6
- Berichten
- 5.670
- Lid sinds
- 18 Jaar
Re: Computer gegenereerde content en Google
Ik moet me hier een klein beetje op de vlakte houden, Wilbert, omdat ik die zinnen voor een goed gewaardeerde klant schrijf. Het bedenken van genoeg varianten op dat soort dingen is inderdaad wel één van mijn hoofdbrekens. Wat heel erg hielp en de voice-overs nóg beter maakte: we concentreren ons vooral op de USP's. Het heeft geen zin om vijfendertig varianten op "verstelbare hoofdsteunen" te bedenken. Zulke items staan gewoon in de lijst met opties. Zaken als een panoramadak, leren bekleding, climate control en een navigatiesysteem zijn zaken die wél aan de orde komen. Dat zijn ook precies de zaken waar potentiële kopers een stukje om voor willen rijden. We beperken de superlatieven ook bewust om de voice-overs informatief en niet te opdringerig te maken, met als bijkomend voordeel dat ik ook wat minder synoniemen voor dat soort dingen hoefde te bedenken....
Je kunt trouwens best veel afleiden uit harde data en gebruiken voor alles wat er mee te maken heeft. Een kamer met zeezicht waarbij je ook weet dat de zee in het westen ligt betekent dat je vanaf je kamer de zon in de zee onder zou moeten zien gaan, om maar een voorbeeld te noemen.
Verder kun je denken aan conditionals: als in plaats XXX al "tropische" in de openingszin is gebruikt, moet je in de volgende zin dat woord niet meer gebruiken dus kies je at random uit zinnen waar "exotische" is gebruikt. Zo vermijd je storende herhalingen.
-
05-10-2015, 12:56 #7
- Berichten
- 1.410
- Lid sinds
- 16 Jaar
Re: Computer gegenereerde content en Google
Logisch dat je niet te veel kunt vertellen, toch interessant om zo met hetzelfde bezig te zijn. Ik ben benieuwd waarmee jullie uiteindelijk komen. Succes!
-
05-10-2015, 14:41 #8
- Berichten
- 5.670
- Lid sinds
- 18 Jaar
Re: Computer gegenereerde content en Google
Nou, ik weet wel: met een dikke factuur, de nieuwe zeilboot is al bijna gekocht :-) Maar je zult het resultaat over een paar maanden wel op de grote automotive sites en handelsplaatsen kunnen horen...
Plaats een
- + Advertentie
- + Onderwerp
Marktplaats
Webmasterforum
- Websites algemeen
- Sitechecks
- Marketing
- Domeinen algemeen
- Waardebepaling
- CMS
- Wordpress
- Joomla
- Magento
- Google algemeen
- SEO
- Analytics
- Adsense
- Adwords
- HTML / XHTML
- CSS
- Programmeren
- PHP
- Javascript
- JQuery
- MySQL
- Ondernemen algemeen
- Belastingen
- Juridisch
- Grafisch ontwerp
- Hosting Algemeen
- Hardware Info
- Offtopic