Back to Question Center
0

Chrome Web Scraper Tutorial fan Semalt Expert

1 answers:

As jo ​​brûke Google Chrome, is in útwreiding foar jo blêder dy't helpe kinne om websiden te skrassen. It is bekend as '' Scrapper, '' en it kin sûnder problemen brûkt wurde. Scrapper sil helpen by it skriuwen fan in webside-ynhâld en it uploaden fan de resultaten nei Google-dokuminten.

Hoe kinne jo in webside brûke troch skraper-útwreiding?

1. Selektearje Chrome Web Store yn Google Chrome;

2. Yn útwreidings meitsje in sykopdracht foar '' Scrapper '';

3. It earste sykresultaat is de tafoeging bekend as '' Scrapper '';

4. Selektearje de knop as "Oan Chrome taheakje";

5. Gean werom nei de Uny fan 'e MPs;

6. Klik op de folgjende link ,

7. Sykje nei ien MP en soargje dat de tagong markearre is:

8. Rjochts-klik om de "Skrape" te kiezen Similar ... "option;

9. De konsole foar scrapper sil opnimme yn in oar finster;

10. Sjoch de skrappende ynhâld yn 'e skraper Konsole;

11. Om de ynhâld te bewarjen as Google Spreadsheet, selektearje "Bewarje nei Google Docs ..."

Taheakke skretting

, it is handich om de basika's fan HTML te begripen, bygelyks, kinne jo fia dizze link

in koarte ynlieding lêze. Litte wy ris yntinke dat wy ynteressearre binne yn alle films dy't starte Asia Argento, in ferneamd Italjaanske aktrise

1. It is in tige detaillearre argyf fan akteurs yn IMDB. 2. Hjir kinne jo alle rollen besjogge troch de aktrise..Litte wy de ynformaasje begjinne, dy't wy belangend binne;

3. Besykje it te meitsjen hoe't it hjirboppe beskreaun is;

4. Jo sjogge dat de list in bytsje ferwurde wurdt. Dit is fanwege it feit dat de list hjir oars kin wurde strukturearre;

5. Kopje nei de skrappelponsole. Boppe links, sjogge jo it lytse fekje wêrby't sizze XPath;

6. Xpath is in soarte fan query-taal dy't wurket foar XML en HTML;

7. XPath kin helpe om de dielen fan 'e side te finen dy't jo belangstelling binne. It folgjende ding is om in passend elemint te finen en de XPath te skriuwen;

8. Lit ús ús tafel regelje;

9. Jo sjogge dat ús besteande XPath, dy't alle gegevens nedich hat, is "// div [3] / div [3] / div [2] / div";

10. XPath jout it systeem yn om it HTML-doc te besjen en it tredde elemint te kiezen, dan it twadde elemint en dan allegear;

11. Mar, wy wolle graach ús gegevens skieden hawwe;

12. Brûk de siden kolommen yn 'e konsole foar scrapper om dat te dwaan;

13. Litte wy earst de titel fine Rjochtsaak brûke Untfang elemint om de titel te besjen;

14. Kontrolearje de titel binnen in tag. It tag taheakje oan 'e XPath;

15. De ekspresje ferskynt goed te funksjonearjen, sa meitsje wy ús earste kolom;

16. Yn it paragraaf "Columns" ferfange de earste kolomnamme nei "titel";

17. Foegje it XPath oan;

18. Yn 'e kolumn is de XPaths relatyf en it betsjut dat "./b" it elemint

kieze. Yn' e XPath foar de titelkolle, taheakje "./b" en selektearje "skrape";

20. Lit ús no fierdergean foar in jier. Jierren kinne binnen ien span fûn wurde;

21. Neamde kolom meitsje troch it lytse plus te selektearjen neist de kolom foar jo titel;

22. Mei help fan XPath "./span" in kolom meitsje foar "jier";

23. Klik op skrappe en besjoch hoe't it jier tafoege waard;

24. Done!

December 6, 2017
Chrome Web Scraper Tutorial fan Semalt Expert
Reply