Mafundisho ya Wavuti ya Wavuti ya Chrome Kutoka kwa Mtaalam wa Semalt

Ikiwa unatumia Google Chrome, kuna kiendelezi cha kivinjari chako ambacho kinaweza kusaidia kuchapa kurasa za wavuti. Inajulikana kama '' Scrapper, '' na inaweza kutumika bila shida. Scrapper itasaidia katika kutofautisha yaliyomo kwenye wavuti na kupakia matokeo kwenye hati za Google.
Jinsi ya chakavu tovuti kwa kutumia kiendelezi cha Scraper?
1. Chagua Duka la Wavuti la Chrome katika Google Chrome;
2. Katika viongezeo, fanya utaftaji wa '' Scrapper '';
3. Matokeo ya kwanza ya utaftaji ni kiongezi kinachojulikana kama '' Scrapper '';
4. Chagua kitufe kilichoorodheshwa kama '' Ongeza kwenye Chrome ";
5. Rudi kwenye orodha ya Wabunge wa Uingereza;
6. Bonyeza kiunga kinachofuata;
7. Sasa angalia mbunge mmoja na hakikisha kiingilio kimewekwa alama;

8. Bonyeza kulia kuchagua chaguo "Scrape Sawa ...";

9. Console ya scrapper itajitokeza kwenye dirisha lingine;
10. Angalia yaliyomo katika koni ya kukagua;
11. Ili kuhakikisha kuwa yaliyomo yamehifadhiwa kama lahajedwali ya Google, chagua "Hifadhi kwa Hati za Google ..."
Kuongeza chakavu
Kabla ya kushikamana na mapishi hii, ni muhimu kuelewa misingi ya HTML. Kwa mfano, unaweza kusoma utangulizi mfupi wa HTML kupitia kiunga hiki
Wacha tufikirie tunapendezwa na sinema zote zilizokuwa na nyota ya Asia Argento, mwigizaji maarufu wa Italia.
1. Kuna kumbukumbu ya kina ya watendaji katika IMDB. Asia Argento tovuti ni: http://www.imdb.com/name/nm0000782/;
2. Hapa, unaweza kutazama majukumu yote yaliyochezwa na mwigizaji. Wacha tuanze kuvua habari tunayopendezwa nayo;
3. Jaribu kuipaka kwa jinsi ilivyoelezewa hapo juu;
4.Utaona kuwa orodha hiyo imepotoshwa kidogo. Hii ni kwa sababu ya ukweli kwamba orodha hapa inaweza kuwa muundo tofauti;
5. Kichwa kwa koni ya kiwiko. Juu kushoto, utaona kisanduku kidogo ambacho kinasema XPath;
6. Xpath ni aina ya lugha ya swala ambayo inafanya kazi kwa XML na HTML;
7. XPath inaweza kusaidia kupata sehemu za ukurasa unaovutia. Jambo linalofuata ni kupata kipengee sahihi na uandike XPath yake;
8. Sasa hebu tujipange meza yetu;
9. utaona kuwa XPath yetu iliyopo, ambayo ina data yote inahitajika ni "// div [3] / div [3] / div [2] / div";
10. XPath inafahamisha Mfumo wa kutazama hati ya HTML na uchague kipengee cha tatu, kisha kitu cha pili na kisha vyote;
11. Lakini, tungependa data zetu zitenganishwe;
12. Tumia sehemu ya nguzo kwenye koni ya kukokota ili ufanye kazi hii;
13. Wacha kwanza tupate kichwa chetu ІІ‚‚њњњ Tumia ukaguzi wa ukaguzi ili kutazama kichwa;
14. Angalia kichwa ndani ya tepe. Ongeza lebo kwenye XPath;

15. Fumbo linaonekana kufanya kazi ipasavyo, kwa hivyo fanya safu yetu ya kwanza;
16. Katika sehemu "nguzo", Badilisha jina la safu ya kwanza kuwa "kichwa";
17. Ongeza XPath kwake;
18. Katika sehemu ya safu, XPaths ni jamaa na inamaanisha kuwa "./b" itachagua kipengee <b>
19. Kwenye XPath ya safu ya kichwa, ongeza "./b" na uchague "chakavu";

20. Sasa tuendelee kwenda kwa mwaka. Miaka inaweza kupatikana ndani ya span moja;
21. Unda safu mpya kwa kuchagua pamoja na ndogo ndogo karibu na safu kwa kichwa chako;
22. Kutumia XPath "./span" unda safu kwa "mwaka";
23. Bonyeza chakavu na uangalie jinsi mwaka uliongezwa;
24. Imemalizika!