Výukový program pro loutkáře - Vynikající výukový průvodce výukového programu pro loutkáře 1 a 2

Puppeteer je open-source java framework, který je vyvinut s node-js knihovnou. Loutkář má schopnost fungovat jako nástroj pro škrábání webu. Může být také použit jako testovací automatizace pro webové aplikace, stejně jako selenový webový ovladač. Popularita Puppeteer se rychle zvyšuje pro automatizaci testování. Předpokladem pro procházení Výukovým programem pro loutkáře jsou základní znalosti příkazového řádku, JavaScriptu, konceptu OOPs a struktury HTML DOM. Kompletní Výukový program pro loutkáře je rozdělena do témat, která jsou uvedena v níže uvedeném obsahu. 

Výukový program pro loutkáře

Výukový program Tosca č. 1: Loutkář - přehled

Tosca konzultace # 2: Proměnné prostředí loutkáře

Tosca konzultace # 3: Přehled škrábání webu Puppeteer a Puppeteer Test Automation

Tosca konzultace # 4: Nainstalujte si Puppeteer 

V tomto článku z Výukový program pro loutkáře, vysvětlíme si přehled loutkářů a proměnné prostředí loutkářů. 

Loutkář - přehled

Puppeteer je open-source java framework, který je vyvinut s knihovnou node-js. Puppeteer je schopen ovládat prohlížeč Chrome přes protokol devtool pomocí aplikačního rozhraní na vysoké úrovni (API). Loutkář je schopen ovládat jak bezhlavé, tak bezhlavé chromové prohlížeče. 

Rámec Puppeteer zavádí Google. Podle funkčnosti nejde o nový koncept. Ale usnadňuje to práci. V zásadě shrnuje seznam aktivit prostřednictvím komprimovaného balíčku.

Jak fungují loutkáři?

  • Puppeteer používá knihovnu Node JS.
  • Node JS umožňuje používat rozhraní API na vysoké úrovni.
  • Rozhraní API jsou schopna ovládat prohlížeč Chrome přes protokol devtool.
  • Ve výchozím nastavení Puppeteer pracuje s bezhlavými prohlížeči Chrome, ale může také komunikovat s bezhlavými prohlížeči Chrome změnou výchozí konfigurace.

Protokol Chrome DevTools:

Pomocí protokolu Chrome DevTools Protocol mohou nástroje, jako je Puppeteer, vybavovat, kontrolovat, ladit a profilovat prohlížeče založené na blikání, jako je Chromium, Chrome atd.

Zde je přístrojové vybavení prohlížeče rozděleno na několik domén, jako je DOM, Debugger, Network atd. Každá doména vysvětluje všechny různé podporované příkazy a generované události.

Vlastnosti Puppeteer:

  • Ruční procesy prostřednictvím prohlížeče Chrome lze automatizovat.
  • Může zachytit snímek obrazovky jakékoli webové stránky a vygeneruje obrázek nebo soubor PDF snímku obrazovky.
  • Z aplikace Puppeteer lze vyvinout jednostránkovou aplikaci pro vykreslování na straně serveru.
  • Může automatizovat odesílání webového formuláře, testování uživatelského rozhraní, vstup z klávesnice atd. Pomocí kontrolních bodů.
  • Poskytuje větší kontrolu nad prohlížečem Chrome.
  • Výchozí režim bez hlavy je velmi rychlý.
  • Podporuje škrábání webu.
  • Schopnost měřit vykreslování a načasování načítání pomocí nástrojů pro analýzu výkonu Chrome.

Puppeteer vs Puppeteer-core:

Od verze Puppeteer v1.7.0, pod dvěma balíčky, jsou k dispozici v každém vydání -

  • balíček puppeteer-core
  • balíček loutkářů

Balíček Puppeteer-core:

Loutkář-jádro je java-base Node library, která je schopna provádět jakoukoli operaci, která podporuje protokol DevTools. Puppeteer-core během instalace nestáhne Chromium. Jako knihovna je Puppeteer-core zcela řízen svým programovým rozhraním. Funkce Puppeteer-core také nelze přizpůsobit všemi proměnnými PUPPETEER_ * env. Základní příkaz k instalaci Puppeteer-core - 

npm install puppeteer-core
# or "yarn add puppeteer-core"

Při použití puppeteer-core budou příkazy include vypadat níže -

const puppeteer = require('puppeteer-core')

Kdy použít Puppeteer-Core:

  • Vyvinout projekt Puppeteer tak, aby používal stávající prohlížeč Chrome přes protokol DevTools, kde není nutné další stahování chrómu.
  • Vyvinout další produkt nebo knihovnu koncového uživatele nad protokolem DevTools. Například jeden projekt může vytvořit generátor snímků obrazovky pomocí puppeteer-core a napsat vlastní skript setup.js, který stáhne headless_shell místo Chromium, aby se ušetřilo úložiště.

Balíček loutkářů:

Loutkář je kompletní produkt pro automatizaci prohlížeče Chrome nebo Chromium. Během instalace stáhne nejnovější verzi Chromia a poté ji bude řídit puppeteer-core. Jako produkt koncového uživatele podporuje Puppeteer všechny proměnné PUPPETEER_ * env, aby přizpůsobil své chování. Základní příkaz k instalaci Puppeteer - 

npm install puppeteer
# or "yarn add puppeteer"

Pokud používáte Puppeteer, zahrňte níže uvedené příkazy -

puppeteer = require(‘puppeteer’)

Rozdíl mezi Puppeteer a Puppeteer-Core:

  • Puppeteer-core nestáhne prohlížeč Chromium automaticky během instalace.
  • Puppeteer-core nezohledňuje všechny proměnné PUPPETEER_ * env.
  • Ve většině projektů používáme produktový balíček Puppeteer.

Bezhlavý chrom:

Bezhlavý chrom znamená, že Puppeteer komunikuje s prohlížečem Chrome jako aplikací na pozadí, což znamená, že chromované uživatelské rozhraní není na obrazovce viditelné. Ve výchozím nastavení Puppeteer spouští aplikaci jako bezhlavý chrom. Ukázka kódu pro spuštění Headless Chrome - 

V tomto příkladu otevíráme bezhlavý chrom, tj. Uživatelské rozhraní Chrome nebude viditelné. To lze provést předáním bezhlavé vlajky jako pravdivé metodě Puppeteer.launch ().

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch({ headless: true });
  // Specify statements for Headless Chrome operations  
  await browser.close();
})();

Headful Chrome:

Headful chrome znamená, že Puppeteer komunikuje s prohlížečem chrome, pro který je na obrazovce viditelné chromované uživatelské rozhraní. Ve výchozím nastavení Puppeteer spouští aplikaci jako bezhlavý chrom. Ukázka kódu pro spuštění Headful Chrome - 

V tomto příkladu otevíráme chrom, který je pro nás viditelný. To lze provést předáním bezhlavého příznaku jako false metodě Puppeteer.launch ().

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch({ headless: false});
  // Specify statements for Headless Chrome operations  
  await browser.close();
})();

Proměnné prostředí loutkáře

Puppeteer pracuje s předdefinovanými proměnnými prostředí pro podporu svých operací. Pokud Puppeteer během instalace nenajde proměnné prostředí, použije se v konfiguračním souboru npm varianta těchto proměnných se sníženou velikostí (spravuje soubor konfigurací NPM). Balíček Puppeteer-core proměnné prostředí nezohledňuje. Nejdůležitější proměnné prostředí Puppeteer jsou - 

  • PUPPETEER_SKIP_CHROMIUM_DOWNLOAD: Dává pokyny, aby se během instalace nestáhlo dodaný Chromium.
  • PUPPETEER_DOWNLOAD_HOST: Přepíše předponu adresy URL, kterou lze použít ke stažení Chromia. 
  • PUPPETEER_DOWNLOAD_PATH: Přepíše cestu ke složce ke stažení. Výchozí cesta je - “ /.local-chromium/ ”kde je kořen balíčku loutkáře.
  • HTTP_PROXY, HTTPS_PROXY, NO_PROXY: Tyto proměnné definují nastavení serveru proxy ke stažení Chromia během instalace.
  • PUPPETEER_CHROMIUM_REVISION: Definuje konkrétní verzi Chromu, kterou má Puppeteer používat.
  • PUPPETEER_EXECUTABLE_PATH: Určuje spustitelnou cestu, která se má použít v metodě Puppeteer.launch. 
  • PUPPETEER_PRODUCT: Definuje, který prohlížeč má Puppeteer použít. Hodnota musí být buď chrom, nebo firefox. 

Závěr:

V tomto úvodním článku o Výukovém programu pro loutkáře jsme se dozvěděli o přehledu loutkářů a proměnných prostředí loutkářů. V dalším článku z Výukový program pro loutkáře, seznámíme se s přehledem Puppeteer Web Scraping a Puppeteer Test Automation. prosím klikněte zde navštívit referenční portál pro tento tutoriál Puppeteer. Také prosím klikněte zde naučit se selen od LambdaGeeks.

Zanechat komentář