Hoi,
Booking stelt voor elk hotel dat ze op hun website hebben staan 1 foto beschikbaar die je op je eigen site mag gebruiken ter promotie. Andere foto's die Booking op de site heeft staan mag je niet gebruiken (nagevraagd).
Welke foto dat is is te vinden in de Booking datadump (.tsv file).
Hierin vind je naast adressen, beschrijvingen, enz van alle hotels ook 1 foto url waar je de beschikbaar gestelde foto kunt downloaden; de photo_url
De foto url is dan bv zo: http://aff.bstatic.com/images/hotel/...6/27601937.jpg
Dit staat er bij:
Accommodation in tab delimited file
Accommodation (by continental area or for whole world) in one tab delimited, utf8 encoded file. Usable in Linux/Unix based software or Excel 2007 and later versions of Excel .
Deze datadump is echter zo immens kennelijk dat deze bij het openen of bij het zoeken crasht. Ik heb een mac en kan hem geloof ik openen met OpenOffice en TextEdit, maar met beide crasht de boel. (tevens zie ik geen kolommen maar dat is mss geen ramp)
Hebben hier mensen ervaring met deze datadump? Of weet iemand misschien een workaround om deze hotel_url te achterhalen via de booking site zelf? Bedankt!
- Booking.com data dump: foto url
-
19-03-2015, 07:02 #1
- Berichten
- 951
- Lid sinds
- 17 Jaar
Booking.com data dump: foto url
-
-
19-03-2015, 10:17 #2
- Berichten
- 5.661
- Lid sinds
- 18 Jaar
Re: Booking.com data dump: foto url
Ik vind LibreOffice (een OpenOffice kloon) altijd het prettigste om zulke bestanden mee te openen en bewerken, en dat gaat op mijn niet eens zo snelle Windhoos machine prima met databases van WordPress sites met soms wel tienduizend posts. Dat zou met een Mac ook moeten kunnen. Kun je het bestand niet eerst splitsen met een teksteditor?
De manier waarop je het opent kan in Open Office Calc wel uitmaken. Misschien herkende hij hem als je hem wilt openen door dubbelklikken wel als tekstdocument. Open eerst Calc, en open daarmee het bestand. Dan krijg je als het goed is een dialoogvenster waarin je de scheiding tussen de cellen etc op moet geven. Meestal wordt dat al automatisch herkend. Trouwens merkwaardig dat ze een tab delimited bestand gebruiken, meestal is het een comma separated bestand.
-
19-03-2015, 10:34 #3
- Berichten
- 951
- Lid sinds
- 17 Jaar
Re: Booking.com data dump: foto url
Bedankt voor je reactie B van der Weerd.
Ik zie door je reactie nu pas dat OpenOffice hem opent met Open Office Writer en niet met Calc.... (ik ben er niet zo in thuis ;)
Als ik eerst Calc open en dan de file zie ik de opties CR, LF en CR&LF. Maar welke ik ook aanklik, hij blijft vervolgens een Writer document openen.
Wel heb ik bij die opties boven de boel op utf8 gezet, is dat goed?
-
19-03-2015, 12:55 #4
- Berichten
- 951
- Lid sinds
- 17 Jaar
Re: Booking.com data dump: foto url
Ik kreeg nog getipt om hem niet via "openen" in calc te openen maar via "insert --> sheet from file"
Dan zie de boel er in het voorbeeld zeg maar wel prima uit, maar de file lijkt te groot om te laden. Na 10 minuten nog niet geopend (file is tegen de gig groot ook...)
-
09-04-2015, 12:30 #5
- Berichten
- 4
- Lid sinds
- 16 Jaar
Re: Booking.com data dump: foto url
Met Sublime Text kun je dit soort grote bestanden wel openen op je PC of MAC.
-
09-04-2015, 13:03 #6
- Berichten
- 5.661
- Lid sinds
- 18 Jaar
Re: Booking.com data dump: foto url
Ik zou 'm dan splitsen met een teksteditor, en alsnog in LibreCalc oid openen/importeren.
-
09-04-2015, 13:56 #7
- Berichten
- 4
- Lid sinds
- 16 Jaar
Re: Booking.com data dump: foto url
Zo is het.
Excell en Libre Office kunnen maar een x aantal regels (rows) aan.
Dat loopt dus gewoon vast omdat het niet kan.
Je kunt het bestand natuurlijk ook gewoon importeren via MySQL.
Xampp er op zetten, via phpMyAdmin importeren.
Alleen je ini file aanpassen zodat je een flink bestand mag importeren.
Dan kun je via phpMyAdmin door je data snuffelen en zoeken.
Plaats een
- + Advertentie
- + Onderwerp
Marktplaats
Webmasterforum
- Websites algemeen
- Sitechecks
- Marketing
- Domeinen algemeen
- Waardebepaling
- CMS
- Wordpress
- Joomla
- Magento
- Google algemeen
- SEO
- Analytics
- Adsense
- Adwords
- HTML / XHTML
- CSS
- Programmeren
- PHP
- Javascript
- JQuery
- MySQL
- Ondernemen algemeen
- Belastingen
- Juridisch
- Grafisch ontwerp
- Hosting Algemeen
- Hardware Info
- Offtopic