Back to Question Center
0

Chrome Web skraper tutorial iz Semalt Expert

1 answers:

Ako koristite Google Chrome, postoji dodatak za vaš pretraživač što može pomoći pri skraćivanju web stranica. Poznat je kao "Scrapper" i može se koristiti bez problema. Skreper će pomoći u čišćenju sadržaja veb-sajta i prenošenje rezultata na Google dokumente.

Kako ukloniti web lokaciju koristeći produžetak skenera?

1. Izaberite Chrome veb prodavnicu u Google Chrome-u;

2. U produžetima izvršiti potragu za '' Scrapper '';

3. Prvi rezultat pretraživanja je produžetak poznat kao "Scrapper";

4. Izaberite taster koji je naveden kao '' Dodaj u Chrome ''

5. Vratite se na liste UK poslanika;

6. Kliknite na sledeći ;

7. Sada potražite jednog MP-a i osigurajte da je unos označen;

8. Desnim tasterom miša kliknite na " Slična ... "opcija;

9. Konzola za skuter će se pojaviti u drugom prozoru;

10. Pogledajte ošišani sadržaj u strugaču konzola;

11. Da biste obezbedili da se sadržaj čuva kao Google tablični računar, odaberite "Spremi na Google dokumente ..."

Prošireno skraćenje

Pre držanja ovog recepta , korisno je razumjeti osnove HTML-a.Na primer, možete pročitati kratak uvod u HTML preko ove link-a

Pretpostavimo da smo zainteresovani za sve filmove koji su igrali Aziju Argento, poznata talijanska glumica

1. U IMDB-u postoji veoma detaljna arhiva aktera: sajt Argentine je: https://www.imdb.com/name/nm0000782/;

2. Ovde možete videti sve uloge glumice..Počnimo da uklonimo informacije koje nas zanimaju;

3. Pokušajte da ga oštetite onako kako je gore opisano;

4. Videćete da je lista malo izobličena. Ovo je zbog činjenice da se lista ovde može strukturirati različito;

5. Pređite na konzolu strugača. Gornji levo, videćete malu kutiju koja govori o XPath-u;

6. Xpath je vrsta jezika upita koja radi za XML i HTML;

7. XPath može pomoći u pronalaženju dijelova stranice u kojoj ste zainteresovani. Sledeća stvar je pronaći odgovarajući element i napisati XPath za to;

8. Sada ćemo organizovati naš sto;

9. Videćete da je naš postojeći XPath, koji ima sve potrebne podatke, "// div [3] / div [3] / div [2] / div";

10. XPath informiše Sistem da vidi HTML dokument i izabere treći element, zatim drugi element, a zatim sve njih;

11. Ali, želimo da naše podatke razdvojimo;

12. Koristite odeljak stupaca u konzoli za skutera da biste ovo uradili;

13. Prvo ćemo pronaći naš naslov "Koristiti Inspect Element" da biste videli naslov;

14. Proverite naslov unutar oznake. Dodajte oznaku na XPath;

15. Izgleda da funkcioniše adekvatno, pa ga napravite našom prvom kolonom;

16. U odeljku "Kolone" zamijenite ime prvog stupca na "naslov";

17. Dodajte XPath njemu;

18. U odeljku kolone, XPath su relativni i to znači da će "./b" odabrati element

19. U XPath za naslovnu kolonu dodajte "./b" i izaberite "skrape";

20. Sada idemo na godinu dana. Godine se mogu naći unutar jednog raspona;

21. Kreirajte novu kolonu tako što ćete izabrati mali plus pored kolone za svoj naslov;

22. Koristeći XPath "./span" kreirajte kolonu za "godinu";

23. kliknite strganje i pogledajte kako je dodata godina;

24. Gotovo!

December 6, 2017
Chrome Web skraper tutorial iz Semalt Expert
Reply