Ik ben met Wordpress bezig om posts met bijna dezelfde titel eruit te filteren. Het is me al gelukt om dit te doen voor posts met EXACT dezelfde titel, door onderstaand script te gebruiken:
Maar ik zie niet hoe ik dit nu moet aanpassen, zodat er gekeken word naar bijvoorbeeld meer dan 3 dezelfde woorden oid.PHP Code:
<?php
require_once(dirname(__FILE__) . '/../../wp-config.php');
require_once(dirname(__FILE__) . '/../../wp-includes/wp-db.php');
$wpdb->show_errors();
$dupes = $wpdb->get_results('select bad_rows.*
from lbcp_posts as bad_rows
inner join (
select post_title, MIN(id) as min_id
from lbcp_posts
group by post_title
having count(*) > 1
) as good_rows on good_rows.post_title = bad_rows.post_title
and good_rows.min_id <> bad_rows.id;
');
foreach ($dupes as $dupe) {
echo $dupe->post_title ."\n";
}
$wpdb->query('
delete bad_rows.*
from lbcp_posts as bad_rows
inner join (
select post_title, MIN(id) as min_id
from lbcp_posts
group by post_title
having count(*) > 1
) as good_rows on good_rows.post_title = bad_rows.post_title
and good_rows.min_id <> bad_rows.id;
');
?>
- Berichten ontdubbelen op basis van bijna gelijkheid
-
23-02-2010, 09:08 #1
- Berichten
- 37
- Lid sinds
- 17 Jaar
Berichten ontdubbelen op basis van bijna gelijkheid
-
In de schijnwerper
Plaats een
- + Advertentie
- + Onderwerp
Marktplaats
Webmasterforum
- Websites algemeen
- Sitechecks
- Marketing
- Domeinen algemeen
- Waardebepaling
- CMS
- Wordpress
- Joomla
- Magento
- Google algemeen
- SEO
- Analytics
- Adsense
- Adwords
- HTML / XHTML
- CSS
- Programmeren
- PHP
- Javascript
- JQuery
- MySQL
- Ondernemen algemeen
- Belastingen
- Juridisch
- Grafisch ontwerp
- Hosting Algemeen
- Hardware Info
- Offtopic