Noch ein kleines Snippet aus meiner SEO-PHP Reihe.
Die Berechnung ist noch nicht optimal, sollte aber für einen groben Eindruck, welche Wörter wie oft auf einer Seite sind und wie das Verhältnis prozentual zu den restlichen Wörtern ist auf jedenfall reichen.
Die Verarbeitung von deutschen Sonderzeichen funktioniert noch nicht optimal, ich werde das Snippet zeitnah noch einmal nachbessern.

Wenn man die auskommentierten Zeilen 20-21 und 28 einkommentiert, werden nur Keywords angezeigt, die mindestens ein Prozent der Seite ausmachen.

Wichtig: das XXX in Zeile 5 muss durch < ersetzt werden, da WordPress das Style Tag ansonsten zerschiesst.

# KEY - ANZAHL - ANZAHL in %
$url="www.morphhome.net";
$str=(html_entity_decode(file_get_contents("http://".$url)));
$str = strip_tags($str);
$str = preg_replace("'XXXstyle[^>]*>.*XXX/style>'siU",'',$str);
$badwords=array("z.B"."-",".","und","die","dass","das","der","auml","ouml","uuml");

foreach($badwords as $value)
{

	$str=str_replace(" ".$value." "," ",$str);

}

$words      = str_word_count(strtolower($str),1);
$word_count = array_count_values($words);

foreach ($word_count as $key=>$val) {
    $density = ($val/count($words))*100;
#   if (round($density,0) > 1)
#	{
		if(strlen($key)>1)
		{

			echo $key." - ".$val." - ".number_format($density,2)."%";

		};
#	}
}

Related posts:

  1. Position einer Seite bei Keyword zeigen
  2. Google Suggestions in Keyword Applikation integrieren
  3. Seiten im Google Index mit PHP+Curl anzeigen
  4. Backlinks und Seitenanzahl über den Yahoo Siteexplorer auslesen
  5. RSS Feed für einen Blog mit PHP erkennen