<?xml version="1.0" encoding="UTF-8"?><!-- generator="wordpress/2.2.2" -->
<rss version="2.0" 
	xmlns:content="http://purl.org/rss/1.0/modules/content/">
<channel>
	<title>Комментарии на запись: PHP парсер PHP Simple HTML DOM Parser</title>
	<link>http://www.interez.ru/archives/88</link>
	<description>SEO, заработать деньги через интернет, интернет-бомжи, интернет реклама и маркетинг, партнерские программы, личностый рост, заметки.</description>
	<pubDate>Fri, 10 Feb 2012 03:04:05 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.2.2</generator>

	<item>
		<title>От: Yurii</title>
		<link>http://www.interez.ru/archives/88#comment-28391</link>
		<author>Yurii</author>
		<pubDate>Thu, 07 Jul 2011 14:22:37 +0000</pubDate>
		<guid>http://www.interez.ru/archives/88#comment-28391</guid>
		<description>echo "Peak memory usage: ".(memory_get_peak_usage(true)/1024/1024)." MB\r\n";
Посмотрите СКОКО ОН ЖРЕТ!!!</description>
		<content:encoded><![CDATA[<p>echo &#8220;Peak memory usage: &#8220;.(memory_get_peak_usage(true)/1024/1024).&#8221; MB\r\n&#8221;;<br />
Посмотрите СКОКО ОН ЖРЕТ!!!</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Павел</title>
		<link>http://www.interez.ru/archives/88#comment-22255</link>
		<author>Павел</author>
		<pubDate>Sat, 15 Jan 2011 10:10:03 +0000</pubDate>
		<guid>http://www.interez.ru/archives/88#comment-22255</guid>
		<description>Упс... Только ж не забудьте убрать экранирующие слэши, а вместо двойных - одинарные.
P.S. Админ, сделай что-нибудь с кодом подтверждения. Я ввожу правильно. Трезв.  :azaza:</description>
		<content:encoded><![CDATA[<p>Упс&#8230; Только ж не забудьте убрать экранирующие слэши, а вместо двойных - одинарные.<br />
P.S. Админ, сделай что-нибудь с кодом подтверждения. Я ввожу правильно. Трезв.  <img src='http://www.interez.ru/wp-includes/images/smilies/smile16.gif' alt=':azaza:' class='wp-smiley' /></p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Павел</title>
		<link>http://www.interez.ru/archives/88#comment-22252</link>
		<author>Павел</author>
		<pubDate>Sat, 15 Jan 2011 10:01:14 +0000</pubDate>
		<guid>http://www.interez.ru/archives/88#comment-22252</guid>
		<description>Да нет же, разобрался уже давно. Всё дело в файле base.txt. Вместе со строчкой из этого файла в переменную $keyword подхватываются символы перевода строки \\n и \\r. Помогло это:
$keyword_old = array (
\&#34;\'\\r\' si\&#34;,
\&#34;\'\\n\' si\&#34;,
);
$keyword_new = array (
\&#34;\&#34;,
\&#34;\&#34;,
);
$keyword = preg_replace($keyword_old, $keyword_new, $keyword);</description>
		<content:encoded><![CDATA[<p>Да нет же, разобрался уже давно. Всё дело в файле base.txt. Вместе со строчкой из этого файла в переменную $keyword подхватываются символы перевода строки \\n и \\r. Помогло это:<br />
$keyword_old = array (<br />
\&quot;\&#8217;\\r\&#8217; si\&quot;,<br />
\&quot;\&#8217;\\n\&#8217; si\&quot;,<br />
);<br />
$keyword_new = array (<br />
\&quot;\&quot;,<br />
\&quot;\&quot;,<br />
);<br />
$keyword = preg_replace($keyword_old, $keyword_new, $keyword);</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Megaultraseo</title>
		<link>http://www.interez.ru/archives/88#comment-22224</link>
		<author>Megaultraseo</author>
		<pubDate>Thu, 13 Jan 2011 19:55:44 +0000</pubDate>
		<guid>http://www.interez.ru/archives/88#comment-22224</guid>
		<description>Павел, может надо использовать urlencode?</description>
		<content:encoded><![CDATA[<p>Павел, может надо использовать urlencode?</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Иван</title>
		<link>http://www.interez.ru/archives/88#comment-21771</link>
		<author>Иван</author>
		<pubDate>Mon, 20 Dec 2010 20:54:25 +0000</pubDate>
		<guid>http://www.interez.ru/archives/88#comment-21771</guid>
		<description>Павел попробуй так там уже допиши все как надо.
$url = ('http://www.google.com/search?hl=en&#38;q='.$keyword);</description>
		<content:encoded><![CDATA[<p>Павел попробуй так там уже допиши все как надо.<br />
$url = (&#8217;http://www.google.com/search?hl=en&amp;q=&#8217;.$keyword);</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Дмитрий</title>
		<link>http://www.interez.ru/archives/88#comment-21108</link>
		<author>Дмитрий</author>
		<pubDate>Sat, 06 Nov 2010 22:43:33 +0000</pubDate>
		<guid>http://www.interez.ru/archives/88#comment-21108</guid>
		<description>Ребят, такой вопрос.
Парсю html-код

$text = file_get_html('http://googe.com');

Теперь ведь код мне надо записать в базу данных, представим, что есть бд, с таблицей одной, у нее одно поле, например sample.

Как это сделать?</description>
		<content:encoded><![CDATA[<p>Ребят, такой вопрос.<br />
Парсю html-код</p>
<p>$text = file_get_html(&#8217;http://googe.com&#8217;);</p>
<p>Теперь ведь код мне надо записать в базу данных, представим, что есть бд, с таблицей одной, у нее одно поле, например sample.</p>
<p>Как это сделать?</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Павел</title>
		<link>http://www.interez.ru/archives/88#comment-20013</link>
		<author>Павел</author>
		<pubDate>Wed, 15 Sep 2010 14:10:07 +0000</pubDate>
		<guid>http://www.interez.ru/archives/88#comment-20013</guid>
		<description>Здравствуйте. Прошу подсказать. Два дня голову ломаю. Написал небольшой парсер, но что-то он не совсем правильно работает. Я его привожу в немного урезанном виде, так как обработчик напарсенного текста работает нормально.

&#60;?php
ob_implicit_flush();
$keywords = file(\&#34;keys.txt\&#34;);
$zapisi = fopen(\&#34;base.txt\&#34;, \&#34;a\&#34;);
foreach ($keywords as $keyword)
{
$num = mt_rand(10,20);
$url = (\&#34;http://www.google.com/search?hl=en&#38;num=$num&#38;q=keyword\&#34;);
$content = file_get_contents($url);
$pos = strpos($content, \&#34;&#60;span&#62;&#60;&#60;/span&#62;div id=ires&#60;span&#62;&#62;\&#34;&#60;/span&#62;);
$content = substr($content, $pos);
$pos = strpos($content, \&#34;&#60;span&#62;&#60;&#60;/span&#62;div id=leftnav&#60;/span&#62;&#62;\&#34;&#60;/span&#62;);
$content = substr($content, 0, $pos);
fwrite($zapisi, $content. \&#34;\\n\&#34;);
echo $content, $url;
sleep (10);
}
fclose($zapisi);
?&#62;

(На кавычки внимания не обращайте,- пришлось изменить, чтобы отобразился код на этой странице)
Файл keys.txt - список кейвордов, где для гугла пробелы заменены на \&#34;+\&#34;.
Когда я заменяю адрес с переменной $keyword 
http://www.google.com/search?hl=en&#38;num=$num&#38;q=$keyword 
на простой запрос, например слово keyword 
http://www.google.com/search?hl=en&#38;num=$num&#38;q=keyword , 
то при парсинге в файл base.txt вписывается всё как надо. Цикл тоже запускается, но естественно запрос каждый раз повторяется один и тот же.
Когда же я в урле ставлю обратно переменную $keyword , парсится какая-то ерунда, совсем не по теме, хотя и с файла keys.txt при каждом новом цикле берется новый по порядку запрос. Может кто знает, что в коде не так. Не программер я, к сожелению.</description>
		<content:encoded><![CDATA[<p>Здравствуйте. Прошу подсказать. Два дня голову ломаю. Написал небольшой парсер, но что-то он не совсем правильно работает. Я его привожу в немного урезанном виде, так как обработчик напарсенного текста работает нормально.</p>
<p>&lt;?php<br />
ob_implicit_flush();<br />
$keywords = file(\&quot;keys.txt\&quot;);<br />
$zapisi = fopen(\&quot;base.txt\&quot;, \&quot;a\&quot;);<br />
foreach ($keywords as $keyword)<br />
{<br />
$num = mt_rand(10,20);<br />
$url = (\&quot;http://www.google.com/search?hl=en&amp;num=$num&amp;q=keyword\&quot;);<br />
$content = file_get_contents($url);<br />
$pos = strpos($content, \&quot;&lt;span&gt;&lt;&lt;/span&gt;div id=ires&lt;span&gt;&gt;\&quot;&lt;/span&gt;);<br />
$content = substr($content, $pos);<br />
$pos = strpos($content, \&quot;&lt;span&gt;&lt;&lt;/span&gt;div id=leftnav&lt;/span&gt;&gt;\&quot;&lt;/span&gt;);<br />
$content = substr($content, 0, $pos);<br />
fwrite($zapisi, $content. \&quot;\\n\&quot;);<br />
echo $content, $url;<br />
sleep (10);<br />
}<br />
fclose($zapisi);<br />
?&gt;</p>
<p>(На кавычки внимания не обращайте,- пришлось изменить, чтобы отобразился код на этой странице)<br />
Файл keys.txt - список кейвордов, где для гугла пробелы заменены на \&quot;+\&quot;.<br />
Когда я заменяю адрес с переменной $keyword<br />
<a href="http://www.google.com/search?hl=en&amp;num=$num&amp;q=$keyword" rel="nofollow">http://www.google.com/search?hl=en&amp;num=$num&amp;q=$keyword</a><br />
на простой запрос, например слово keyword<br />
<a href="http://www.google.com/search?hl=en&amp;num=$num&amp;q=keyword" rel="nofollow">http://www.google.com/search?hl=en&amp;num=$num&amp;q=keyword</a> ,<br />
то при парсинге в файл base.txt вписывается всё как надо. Цикл тоже запускается, но естественно запрос каждый раз повторяется один и тот же.<br />
Когда же я в урле ставлю обратно переменную $keyword , парсится какая-то ерунда, совсем не по теме, хотя и с файла keys.txt при каждом новом цикле берется новый по порядку запрос. Может кто знает, что в коде не так. Не программер я, к сожелению.</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Arthur</title>
		<link>http://www.interez.ru/archives/88#comment-18117</link>
		<author>Arthur</author>
		<pubDate>Fri, 28 May 2010 22:13:02 +0000</pubDate>
		<guid>http://www.interez.ru/archives/88#comment-18117</guid>
		<description>Для тех, у кого проблемы с пожиранием памяти, юзайте clear();

foreach($html-&#62;find('div[class="video]') as $container) {
$item['title']     = $container-&#62;find('h2[class="videoTitle"]', 0)-&#62;plaintext;
$item['img']    = $container-&#62;find('img[class="t"]', 0)-&#62;src;
$item['href'] = str_replace("/", "", $container-&#62;find('a[class="s"]', 0)-&#62;href);
$containers[] = $item;

//И сама очистка
$container-&#62;clear();
}
//и ещё раз
$html-&#62;clear();</description>
		<content:encoded><![CDATA[<p>Для тех, у кого проблемы с пожиранием памяти, юзайте clear();</p>
<p>foreach($html-&gt;find(&#8217;div[class=&#8221;video]&#8217;) as $container) {<br />
$item[&#8217;title&#8217;]     = $container-&gt;find(&#8217;h2[class=&#8221;videoTitle&#8221;]&#8217;, 0)-&gt;plaintext;<br />
$item[&#8217;img&#8217;]    = $container-&gt;find(&#8217;img[class=&#8221;t&#8221;]&#8217;, 0)-&gt;src;<br />
$item[&#8217;href&#8217;] = str_replace(&#8221;/&#8221;, &#8220;&#8221;, $container-&gt;find(&#8217;a[class=&#8221;s&#8221;]&#8217;, 0)-&gt;href);<br />
$containers[] = $item;</p>
<p>//И сама очистка<br />
$container-&gt;clear();<br />
}<br />
//и ещё раз<br />
$html-&gt;clear();</p>
]]></content:encoded>
	</item>
</channel>
</rss>

