Wie weet er een handige manier of tooltje voor het volgende:

Voor een projectje moet ik adressen van websites verzamelen + contact/bedrijfs info van websites die een bepaald iets doen.
Nu kan ik wel 100 zoekwoorden verzinnen om op te zoeken waarbij ik in totaal 5 miljoen resultaten of meer krijg.
Maar dan heb ik van elke site 500 of meer pagina's en bij verschillende zoekopdrachten steeds veel dezelfde sites.
Daardoor zullen er veel dubbele in de lijst kunnen komen of moet ik elk adres in een lange lijst controleren of ik die al heb (ik verwacht paar duizend unieke resultaten te kunnen krijgen).

Is er ook een manier/tool om resultaten die ik l heb uit de Google zoekopdrachten weg te laten? Dus ik heb site à.nl al en c.nl en d.nl en dat dan alle resultaten van die sites ( dus ook met /pagina/categorie.html) uit de zoekresultaten wegblijven zodat aantal resultaten steeds beperkter wordt en ik minder hoef te zoeken.

Of een tooltje waar ik zoekresultaten in kan invoeren en gelijk duidelijk krijg of het er al instaat.
Uiteindelijk moet ik voor alle gevonden sites ook e-mail adres, bedrijfsnaam, adres/postcode enz. Zien te verkrijgen.

Gegevens die ik verzamel zijn niet om openbaar te maken maar gebruik ik voor andere doeleinden.
Hopelijk weet iemand hiervoor iet.