ਨੋਡਜੇਐਸ ਅਤੇ ਕਠਪੁਤਲੀ ਦੇ ਨਾਲ ਵੈਬ ਸਕ੍ਰੈਪਿੰਗ
ਜਾਣ -ਪਛਾਣ
ਜਿਵੇਂ ਕਿ ਤੁਸੀਂ ਸ਼ਾਇਦ ਮੇਰੀ ਪ੍ਰੋਫਾਈਲ ਦੀ ਜਾਂਚ ਕੀਤੀ ਹੈ, ਮੈਂ ਇੱਥੇ ਤਕਨੀਕੀ ਸਮਗਰੀ ਦਾ ਇੰਚਾਰਜ ਨਹੀਂ ਹਾਂ ਕੂਪੋਲ . ਇਸ ਤਰ੍ਹਾਂ, ਇਹ ਪੋਸਟ ਕਿਤੇ ਵੀ ਬਾਹਰ ਨਹੀਂ ਹੈ.
ਕਿਉਂ?
ਇੱਕ ਵਾਕ ਵਿੱਚ, ਕੂਪੋਲ brandsਨਲਾਈਨ ਕੀਮਤ ਨਿਗਰਾਨੀ ਨੂੰ ਸਵੈਚਾਲਤ ਕਰਨ ਵਾਲੇ ਬ੍ਰਾਂਡਾਂ ਅਤੇ ਵਿਕਰੇਤਾਵਾਂ ਦੀ ਸਹਾਇਤਾ ਕਰਦਾ ਹੈ. ਪਰਿਭਾਸ਼ਾ ਅਨੁਸਾਰ, ਕੂਪੋਲ ਇੱਕ ਨਵੀਨਤਾਕਾਰੀ ਅਤੇ ਤਕਨੀਕੀ ਸਾਸ ਹੱਲ ਹੈ.
ਵੈਸੇ ਵੀ ਨਵੀਨਤਾਵਾਂ ਅਤੇ ਤਕਨੀਕੀ ਮਾਮਲਿਆਂ ਬਾਰੇ ਉਤਸ਼ਾਹੀ, ਮੈਂ ਹਮੇਸ਼ਾਂ ਵਿਕਾਸ ਵਿੱਚ ਕਿਤੇ ਨਾ ਹੋਣ ਕਾਰਨ ਥੋੜਾ ਨਿਰਾਸ਼ ਸੀ, ਮੇਰਾ ਮਤਲਬ ਆਧੁਨਿਕ ਵਿਕਾਸ ;-).
ਇਹੀ ਕਾਰਨ ਹੈ ਕਿ ਮੈਂ ਆਪਣੀ ਮੁੱਖ ਗਤੀਵਿਧੀਆਂ ਤੋਂ ਇਲਾਵਾ, ਆਪਣੇ ਪ੍ਰੋਗਰਾਮਿੰਗ ਅਧਿਆਇ ਨੂੰ ਦੁਬਾਰਾ ਖੋਲ੍ਹਣ ਅਤੇ ਆਪਣੇ ਤਕਨੀਕੀ ਹੁਨਰਾਂ ਵਿੱਚ ਸੁਧਾਰ ਕਰਨ ਦਾ ਫੈਸਲਾ ਕੀਤਾ.
ਇੱਕ ਪ੍ਰੋਜੈਕਟ ਮਾਲਕ ਹੋਣ ਦੇ ਨਾਤੇ, ਮੈਨੂੰ ਯਕੀਨ ਹੈ ਕਿ ਤਕਨੀਕੀ ਚੁਣੌਤੀਆਂ ਦੇ ਪ੍ਰਤੀ ਜਾਗਰੂਕ ਹੋਣਾ, ਸਮਝਣਾ ਅਤੇ ਕਲਪਨਾ ਕਰਨਾ, ਤਕਨੀਕੀ ਟੀਮ ਦੇ ਚੰਗੇ ਵਿਕਾਸ ਲਈ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕੂਪੋਲ .
ਇਸ ਲੇਖ ਵਿਚ, ਮੈਂ ਇਹ ਦੱਸਣਾ ਚਾਹਾਂਗਾ ਕਿ ਵੈਬ ਸਕ੍ਰੈਪਿੰਗ ਨੂੰ ਅਰੰਭ ਕਰਨਾ ਕਿਵੇਂ ਸੌਖਾ ਹੋ ਸਕਦਾ ਹੈ. ਨਾ ਡਰੋ. ਭਾਵੇਂ ਤੁਸੀਂ ਡਿਵੈਲਪਰ ਨਹੀਂ ਹੋ, ਮੈਨੂੰ ਯਕੀਨ ਹੈ ਕਿ ਤੁਹਾਡੇ ਵਿੱਚੋਂ ਬਹੁਤ ਸਾਰੇ ਉਸ ਮਹੱਤਵਪੂਰਣ ਵਿਸ਼ੇ ਵਿੱਚ ਦਿਲਚਸਪੀ ਰੱਖਦੇ ਹਨ.
ਵੈਬ ਸਕ੍ਰੈਪਿੰਗ ਬਹੁਤ ਸਾਰੇ ਵੱਖੋ ਵੱਖਰੇ ਮਾਮਲਿਆਂ ਵਿੱਚ ਉਪਯੋਗੀ ਹੈ. ਜਿਵੇਂ ਹੀ ਤੁਹਾਨੂੰ ਕਰਨਾ ਪਵੇਗਾ ਨਕਲ ਉਤਾਰਨਾ ਇੱਕ ਕਾਰੋਬਾਰੀ ਡਿਵੈਲਪਰ, ਵਿਕਰੀ, ਜਾਂ ਇੱਥੋਂ ਤੱਕ ਕਿ ਇੱਕ ਭਰਤੀ ਕਰਨ ਵਾਲੇ ਦੇ ਰੂਪ ਵਿੱਚ ਕਈ ਸਰੋਤਾਂ ਤੋਂ ਡੇਟਾ. ਚੁਣੌਤੀ ਹਮੇਸ਼ਾਂ ਸਮਾਨ ਹੁੰਦੀ ਹੈ: ਸੰਬੰਧਤ ਡੇਟਾ ਇਕੱਤਰ ਕਰੋ.
ਦੁਬਾਰਾ ਫਿਰ, ਇਹ ਯਾਦ ਰੱਖੋ ਕਿ ਇਹ ਲੇਖ ਮੇਰੇ ਵਰਗੇ ਤਕਨੀਕੀ ਲੋਕਾਂ ਨੂੰ ਨਹੀਂ ਸਮਰਪਿਤ ਹੈ.
ਇਹ ਕਿਹਾ ਜਾ ਰਿਹਾ ਹੈ, ਹੇਠ ਲਿਖੀਆਂ ਲਾਈਨਾਂ ਇਸ ਵਿੱਚੋਂ ਲੰਘਣਗੀਆਂ ਕਿ ਮੈਂ ਵੈਬ ਸਕ੍ਰੈਪਿੰਗ ਨੂੰ ਕਿਵੇਂ ਅਰੰਭ ਕਰਨਾ ਹੈ ਬਾਰੇ ਆਪਣੇ ਆਪ ਸਿੱਖਿਆ.
ਇੱਥੇ ਇਸ ਬਾਰੇ ਸੰਖੇਪ ਜਾਣਕਾਰੀ ਹੈ ਕਿ ਅਸੀਂ ਕਿਸ ਬਾਰੇ ਚਰਚਾ ਕਰਾਂਗੇ:
- ਕੋਡ ਸੰਪਾਦਕ: ਵਿਜ਼ੁਅਲ ਸਟੂਡੀਓ ਕੋਡ
- ਪ੍ਰੋਗਰਾਮਿੰਗ ਭਾਸ਼ਾ: ਜਾਵਾ ਸਕ੍ਰਿਪਟ (Node.js)
- ਵੈਬ ਸਕ੍ਰੈਪਿੰਗ ਲਾਇਬ੍ਰੇਰੀ: ਮਸ਼ਹੂਰ ਕਠਪੁਤਲੀ
ਤਿਆਰ ਹੋ? ਆਓ ਸ਼ੁਰੂ ਕਰੀਏ.
ਕੋਡਸ ਸੰਪਾਦਕ: ਵਿਜ਼ੁਅਲ ਸਟੂਡੀਓ ਕੋਡ
ਇਸ ਟਿorialਟੋਰਿਅਲ ਵਿੱਚ, ਮੈਂ ਵਿਜ਼ੁਅਲ ਕੋਡ ਸੰਪਾਦਕ ਦੀ ਵਰਤੋਂ ਕਰਾਂਗਾ. ਤੁਸੀਂ ਇੱਥੇ ਕਲਿਕ ਕਰਕੇ ਨਵੀਨਤਮ ਸੰਸਕਰਣ ਨੂੰ ਡਾਉਨਲੋਡ ਕਰ ਸਕਦੇ ਹੋ: https://code.visualstudio.com/
ਇੱਥੇ IDE ਦੇ ਕੁਝ ਫਾਇਦੇ ਹਨ:
- ਅਖੀਰੀ ਸਟੇਸ਼ਨ : ਵਿਜ਼ੁਅਲ ਸਟੂਡੀਓ ਕੋਡ ਇਸਦੇ ਟਰਮੀਨਲ ਦਾ ਮਾਲਕ ਹੈ. ਇਹ ਤੁਹਾਨੂੰ IDE ਅਤੇ ਕੋਡ ਚੱਲਣ ਦੇ ਟਰਮੀਨਲ ਦੇ ਵਿੱਚ ਹਰ ਸਮੇਂ ਬਦਲਣ ਤੋਂ ਬਚਣ ਵਿੱਚ ਸਹਾਇਤਾ ਕਰੇਗਾ. ਇਹ ਕੁਸ਼ਲ ਹੈ.
- ਏਕੀਕ੍ਰਿਤ ਗੀਟ : ਵਿਜ਼ੁਅਲ ਸਟੂਡੀਓ ਕੋਡ ਵਿੱਚ ਹਰ ਉਸ ਤਬਦੀਲੀ ਦੀ ਪਾਲਣਾ ਕਰਨ ਲਈ ਗੀਟ ਸ਼ਾਮਲ ਹੈ ਜੋ ਤੁਸੀਂ ਆਪਣੇ ਕੋਡ ਵਿੱਚ ਕਰ ਸਕਦੇ ਹੋ. ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿੱਚ (ਸ਼ੁਰੂਆਤ ਕਰਨ ਵਾਲਿਆਂ ਲਈ), ਇਹ ਤੁਹਾਨੂੰ ਕੋਡ ਇਤਿਹਾਸ ਵਿੱਚ ਵਾਪਸ ਆਉਣ ਦੀ ਆਗਿਆ ਦੇਵੇਗਾ ਜੇ ਤੁਸੀਂ ਕੋਈ ਗਲਤੀ ਕੀਤੀ ਹੈ ਅਤੇ ਵਾਪਸ ਮੁੜਨਾ ਚਾਹੁੰਦੇ ਹੋ.
- ਆਟੋਮੈਟਿਕ ਬੱਚਤ : ਵਿਜ਼ੁਅਲ ਸਟੂਡੀਓ ਕੋਡ ਆਪਣੇ ਆਪ ਤੁਹਾਡੇ ਕੋਡ ਨੂੰ ਸੁਰੱਖਿਅਤ ਕਰ ਲਵੇਗਾ. ਇਸ ਤਰ੍ਹਾਂ, ਜੇ ਤੁਸੀਂ ਪ੍ਰੋਗਰਾਮਿੰਗ ਕਰਦੇ ਸਮੇਂ ਕੋਈ ਗਲਤੀ ਹੋਈ ਹੈ, ਤਾਂ ਯਕੀਨੀ ਬਣਾਓ ਕਿ ਤੁਸੀਂ ਆਪਣਾ ਕੋਡ ਵਾਪਸ ਪ੍ਰਾਪਤ ਕਰੋਗੇ. ਇਸ ਲਈ ਤੁਸੀਂ ਇਸ ਗੱਲ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਤ ਕਰ ਸਕਦੇ ਹੋ ਕਿ ਕਿਹੜੀ ਚੀਜ਼ ਮਹੱਤਵਪੂਰਣ ਹੈ.
- ਐਕਸਟੈਂਸ਼ਨਾਂ : ਵਿਜ਼ੁਅਲ ਸਟੂਡੀਓ ਕੋਡ ਤੁਹਾਨੂੰ ਇਸਦੇ ਸੰਭਾਵਤ ਐਕਸਟੈਂਸ਼ਨਾਂ ਨੂੰ ਜੋੜਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਇਸਦੇ ਵੱਡੇ ਵਿਕਾਸਕਰਤਾਵਾਂ ਦੇ ਭਾਈਚਾਰੇ ਦਾ ਧੰਨਵਾਦ. ਉਦਾਹਰਣ ਦੇ ਲਈ, ਤੁਸੀਂ ਆਪਣੇ ਮਾਰਗ ਨੂੰ ਮੁੜ ਪ੍ਰਾਪਤ ਕਰਨ ਵਿੱਚ ਸਹਾਇਤਾ ਲਈ ਐਕਸਟੈਂਸ਼ਨਾਂ ਨੂੰ ਉਜਾਗਰ ਕਰਨ ਵਾਲਾ ਕੋਡ ਸ਼ਾਮਲ ਕਰ ਸਕਦੇ ਹੋ, ਆਦਿ.
ਇਸ ਬਲੌਗ ਪੋਸਟ ਦਾ ਉਦੇਸ਼ ਇਸ ਹੱਲ ਨੂੰ ਉਤਸ਼ਾਹਤ ਕਰਨਾ ਨਹੀਂ ਹੈ. ਜੇ ਤੁਸੀਂ ਕਿਸੇ ਹੋਰ ਨਾਲ ਬਿਹਤਰ ਮਹਿਸੂਸ ਕਰਦੇ ਹੋ, ਤਾਂ ਕਿਰਪਾ ਕਰਕੇ ਆਪਣੀ ਵਰਤੋਂ ਕਰੋ!
ਭਾਗ I - ਵਾਤਾਵਰਣ ਸਥਾਪਤ ਕਰੋ
A. ਮੈਕ ਤੇ Node.j ਨੂੰ ਕਿਵੇਂ ਇੰਸਟਾਲ ਕਰਨਾ ਹੈ?
ਕਠਪੁਤਲੀ ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ, ਸਾਨੂੰ ਪਹਿਲਾਂ ਆਪਣੇ ਵਿਕਾਸ ਵਾਤਾਵਰਣ ਨੂੰ ਸਥਾਪਤ ਕਰਨ ਦੀ ਜ਼ਰੂਰਤ ਹੈ. ਕਠਪੁਤਲੀ ਲਾਇਬ੍ਰੇਰੀ (ਜਾਵਾ ਸਕ੍ਰਿਪਟ ਲਾਇਬ੍ਰੇਰੀ) ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ, ਸਾਨੂੰ ਇੱਕ Node.js ਵਾਤਾਵਰਣ ਸਥਾਪਤ ਕਰਨ ਦੀ ਜ਼ਰੂਰਤ ਹੈ. ਚਿੰਤਾ ਨਾ ਕਰੋ, ਇਸ ਵਿੱਚ ਸਿਰਫ ਕੁਝ ਮਿੰਟ ਲੱਗਦੇ ਹਨ ...
ਕਦਮ 1
ਟਰਮੀਨਲ ਖੋਲ੍ਹੋ
ਪਾਈਥਨ ਗੁਆਈ ਲਾਇਬ੍ਰੇਰੀਆਂ 2020
ਕਦਮ 2. ਏ: ਜੇ ਤੁਹਾਡੇ ਕੋਲ Node.js ਸਥਾਪਤ ਹੈ
ਦਾਖਲ ਕਰੋ ਹੇਠ ਦਿੱਤਾ ਕੋਡ ਪਹਿਲਾਂ ਤੋਂ ਸਥਾਪਤ Node.js ਸੰਸਕਰਣ ਦੀ ਜਾਂਚ ਕਰਨ ਲਈ.
node -v
ਆਪਣੇ ਨੋਡ.ਜੇਐਸ ਸੰਸਕਰਣ ਨੂੰ ਅਪਡੇਟ ਕਰਨ ਲਈ: ਮੈਂ ਤੁਹਾਨੂੰ ਹੇਠ ਲਿਖੀ ਕਮਾਂਡ ਲਾਈਨ ਚਲਾਉਣ ਦੀ ਸਿਫਾਰਸ਼ ਕਰਦਾ ਹਾਂ:
npm i -g npm
ਜੇ ਤੁਸੀਂ ਬਹੁਤ ਕੁਝ ਪ੍ਰਾਪਤ ਕਰਦੇ ਹੋ ਇਜਾਜ਼ਤਾਂ ਦੀ ਜਾਂਚ ਕਰੋ ਚੇਤਾਵਨੀ, ਤੁਹਾਨੂੰ ਚਲਾ ਕੇ ਕਮਾਂਡ ਨੂੰ ਸੁਪਰਯੂਜ਼ਰ ਵਜੋਂ ਚਲਾਉਣਾ ਪੈ ਸਕਦਾ ਹੈ:
sudo npm i -g npm
ਟਰਮੀਨਲ ਸ਼ਾਇਦ ਤੁਹਾਨੂੰ ਉਸ ਸਥਿਤੀ ਵਿੱਚ ਆਪਣਾ ਪਾਸਵਰਡ ਟਾਈਪ ਕਰਨ ਲਈ ਕਹੇਗਾ.
ਕਦਮ 2. ਬੀ: ਜੇ ਤੁਹਾਡੇ ਕੋਲ Node.js ਪਹਿਲਾਂ ਹੀ ਸਥਾਪਤ ਨਹੀਂ ਹੈ
- ਵੱਲ ਜਾ nodejs.org , ਅਤੇ ਮੈਕੋਸ ਲਈ ਨਵੀਨਤਮ ਸੰਸਕਰਣ ਡਾਉਨਲੋਡ ਕਰੋ.
- ਜਦੋਂ ਫਾਈਲ ਡਾਉਨਲੋਡ ਹੋ ਜਾਂਦੀ ਹੈ, ਤਾਂ .pkg ਫਾਈਲ ਨੂੰ ਇੰਸਟਾਲ ਕਰਨ ਲਈ ਉਸ 'ਤੇ ਦੋ ਵਾਰ ਕਲਿਕ ਕਰੋ. ਮੈਂ ਤੁਹਾਨੂੰ ਜ਼ਿਆਦਾਤਰ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਸਮਰਪਿਤ ਐਲਟੀਐਸ ਸੰਸਕਰਣ ਨੂੰ ਡਾਉਨਲੋਡ ਕਰਨ ਦੀ ਸਿਫਾਰਸ਼ ਕਰਦਾ ਹਾਂ.
3. ਸਾਰੀ ਇੰਸਟਾਲੇਸ਼ਨ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚੋਂ ਲੰਘੋ
4. ਜਦੋਂ ਇੰਸਟਾਲੇਸ਼ਨ ਮੁਕੰਮਲ ਹੋ ਜਾਂਦੀ ਹੈ, ਟਰਮੀਨਲ ਖੋਲ੍ਹੋ ਅਤੇ ਹੇਠਾਂ ਦਿੱਤਾ ਕੋਡ ਦਾਖਲ ਕਰੋ, ਇਹ ਤਸਦੀਕ ਕਰਨ ਲਈ ਕਿ ਨੋਡ.ਜੇਐਸ ਸਹੀ installedੰਗ ਨਾਲ ਸਥਾਪਤ ਹੈ, ਅਤੇ ਸੰਸਕਰਣ ਦੀ ਜਾਂਚ ਕਰਨ ਲਈ.
node -v
ਜੇ ਇੱਕ ਸੰਸਕਰਣ ਪ੍ਰਦਰਸ਼ਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਤੁਸੀਂ ਅਗਲੇ ਭਾਗ ਲਈ ਤਿਆਰ ਹੋ.
B. ਕਠਪੁਤਲੀ ਲਾਇਬ੍ਰੇਰੀ ਨੂੰ ਕਿਵੇਂ ਸਥਾਪਤ ਕਰਨਾ ਹੈ?
ਕਠਪੁਤਲੀ ਇੱਕ ਨੋਡ ਲਾਇਬ੍ਰੇਰੀ ਹੈ ਜੋ ਤੁਹਾਨੂੰ ਇੱਕ ਕ੍ਰੋਮ ਬ੍ਰਾਉਜ਼ਰ ਨੂੰ ਨਿਯੰਤਰਣ ਅਤੇ ਸਵੈਚਾਲਤ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ ਪਰ ਸਿਰ -ਰਹਿਤ ਤਰੀਕੇ ਨਾਲ. ਠੀਕ ਹੈ, ਥੋੜਾ ਉਲਝਣ ਵਾਲਾ, ਆਓ ਇਸ ਹਿੱਸੇ ਦੇ ਵਿਸਥਾਰ ਲਈ ਕੁਝ ਸਮਾਂ ਕੱੀਏ.
ਸਿਰ ਰਹਿਤ ਕਰੋਮ ਕ੍ਰੋਮ 59 ਵਿੱਚ ਸ਼ਿਪਿੰਗ ਹੈ ਅਸਲ ਵਿੱਚ, ਬਿਨਾਂ ਕ੍ਰੋਮ ਦੇ ਕ੍ਰੋਮ ਚਲਾਉਣਾ! ਇਹ ਲਿਆਉਂਦਾ ਹੈ ਸਾਰੀਆਂ ਆਧੁਨਿਕ ਵੈਬ ਪਲੇਟਫਾਰਮ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਕ੍ਰੋਮਿਅਮ ਅਤੇ ਬਲਿੰਕ ਰੈਂਡਰਿੰਗ ਇੰਜਨ ਦੁਆਰਾ ਕਮਾਂਡ ਲਾਈਨ ਨੂੰ ਪ੍ਰਦਾਨ ਕੀਤਾ ਗਿਆ.
ਇਹ ਲਾਭਦਾਇਕ ਕਿਉਂ ਹੈ?
ਇੱਕ ਸਿਰ -ਰਹਿਤ ਬ੍ਰਾਉਜ਼ਰ ਸਵੈਚਲਿਤ ਟੈਸਟਿੰਗ ਅਤੇ ਸਰਵਰ ਵਾਤਾਵਰਣ ਲਈ ਇੱਕ ਵਧੀਆ ਸਾਧਨ ਹੈ ਜਿੱਥੇ ਤੁਹਾਨੂੰ ਇੱਕ ਦਿੱਖ UI ਸ਼ੈੱਲ ਦੀ ਜ਼ਰੂਰਤ ਨਹੀਂ ਹੁੰਦੀ. ਉਦਾਹਰਣ ਦੇ ਲਈ, ਤੁਸੀਂ ਇੱਕ ਅਸਲ ਵੈਬ ਪੇਜ ਦੇ ਵਿਰੁੱਧ ਕੁਝ ਟੈਸਟ ਚਲਾਉਣਾ ਚਾਹੋਗੇ, ਇਸਦੀ ਇੱਕ ਪੀਡੀਐਫ ਬਣਾ ਸਕਦੇ ਹੋ, ਜਾਂ ਸਿਰਫ ਜਾਂਚ ਕਰ ਸਕਦੇ ਹੋ ਕਿ ਬ੍ਰਾਉਜ਼ਰ ਇੱਕ ਯੂਆਰਐਲ ਕਿਵੇਂ ਪੇਸ਼ ਕਰਦਾ ਹੈ.
ਸਰੋਤ: https://developers.google.com/web/updates/2017/04/headless-chrome
ਹੁਣ, ਤੁਸੀਂ ਕਠਪੁਤਲੀ ਲਾਇਬ੍ਰੇਰੀ ਦੇ ਉਦੇਸ਼ ਨੂੰ ਸਮਝਦੇ ਹੋ.
ਇਸ ਲਈ, ਇਸਨੂੰ ਸਹੀ ਜਗ੍ਹਾ ਤੇ ਕਿਵੇਂ ਸਥਾਪਤ ਕਰਨਾ ਹੈ. ਖੋਲ੍ਹੋ ਅਖੀਰੀ ਸਟੇਸ਼ਨ , ਉਹ ਜਗ੍ਹਾ ਚੁਣੋ ਜੋ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ (ਉਦਾਹਰਣ ਵਜੋਂ ਤੁਹਾਡੇ ਤੇ ਡੈਸਕਟਾਪ ), ਅਤੇ ਸਾਡੇ ਵੈਬ ਸਕ੍ਰੈਪਿੰਗ ਪ੍ਰੋਜੈਕਟ ਲਈ ਇੱਕ ਸਮਰਪਿਤ ਡਾਇਰੈਕਟਰੀ ਬਣਾਉ:
mkdir project1
ਹੁਣ ਉਸ ਡਾਇਰੈਕਟਰੀ ਦੇ ਅੰਦਰ ਕਠਪੁਤਲੀ ਸਥਾਪਤ ਕਰੋ ਪ੍ਰੋਜੈਕਟ 1 ਹੇਠਲੀਆਂ ਕਮਾਂਡਾਂ ਚਲਾ ਕੇ
npm install puppeteer
ਸਮੁੰਦਰ ਦੇ ਪੱਧਰ ਤੋਂ ਉੱਪਰ ਇੱਕ ਪੈਕੇਜ ਮੈਨੇਜਰ ਹੈ ਜੋ ਪਹਿਲਾਂ ਹੀ ਸਥਾਪਤ Node.js ਦੇ ਨਾਲ ਆਟੋਮੈਟਿਕਲੀ ਆਉਂਦਾ ਹੈ. ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਇਹ ਤੁਹਾਡੇ ਲਈ ਕਠਪੁਤਲੀ ਸਥਾਪਨਾ ਪ੍ਰਕਿਰਿਆ ਦਾ ਪ੍ਰਬੰਧਨ ਕਰੇਗਾ, ਜਿਸ ਜਗ੍ਹਾ ਤੇ ਤੁਸੀਂ ਹੋ. ਇਸ ਤਰ੍ਹਾਂ ਉਪਰੋਕਤ ਕੋਡ ਨੂੰ ਚਲਾ ਕੇ, ਇਹ ਕ੍ਰੋਮਿਅਮ ਦੇ ਨਵੀਨਤਮ ਸੰਸਕਰਣ ਨੂੰ ਡਾਉਨਲੋਡ ਅਤੇ ਬੰਡਲ ਕਰੇਗਾ.
ਇਹ ਹੀ ਗੱਲ ਹੈ.
ਹੁਣ, ਅਸੀਂ ਵੈਬ ਸਕ੍ਰੈਪਿੰਗ ਸ਼ੁਰੂ ਕਰ ਸਕਦੇ ਹਾਂ.
ਭਾਗ II - ਵੈਬ ਸਕ੍ਰੈਪਿੰਗ
ਹੁਣ, ਸਭ ਤੋਂ ਵਧੀਆ ਹਿੱਸਾ. ਆਓ ਵੈਬ ਨੂੰ ਸਕ੍ਰੈਪ ਕਰਨਾ ਅਰੰਭ ਕਰੀਏ. ਓ, ਠੀਕ ਹੈ, ਆਓ ਪਹਿਲੇ ਪੰਨੇ ਤੇ ਅਰੰਭ ਕਰੀਏ ...
ਇੱਥੇ ਸਾਡੇ ਸਕ੍ਰੈਪਿੰਗ ਉਦੇਸ਼ ਹਨ:
ਟਵਿੱਟਰ ਪ੍ਰਾਈਵੇਟ ਖਾਤਾ ਦਰਸ਼ਕ
- ਕਠਪੁਤਲੀ ਸ਼ੁਰੂ ਕਰੋ ਅਤੇ ਇੱਕ ਖਾਸ ਉਤਪਾਦ ਪੰਨੇ ਤੇ ਜਾਓ
- ਸਿਰਲੇਖ, ਵਰਣਨ, ਅਤੇ ਉਤਪਾਦ ਦੀ ਕੀਮਤ ਨੂੰ ਸਕ੍ਰੈਪ ਕਰੋ
ਕਦਮ 1 - ਅਰੰਭ ਕਰਨਾ
ਇਜਾਜ਼ਤਾਂ ਨੂੰ ਰੱਦ ਕਰਨਾ
ਆਓ ਇੱਕ ਬਹੁਤ ਹੀ ਸਧਾਰਨ ਉਦਾਹਰਣ ਨਾਲ ਅਰੰਭ ਕਰੀਏ: https://www.theslanket.com .
ਸਕ੍ਰੈਪ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ, ਇਹ ਸੁਨਿਸ਼ਚਿਤ ਕਰੋ ਕਿ ਵੈਬਸਾਈਟ ਇਸਨੂੰ ਆਪਣੀ robots.txt ਫਾਈਲ ਵਿੱਚ ਵਰਜਿਤ ਨਹੀਂ ਕਰ ਰਹੀ ਹੈ. ਇਸ ਸਥਿਤੀ ਵਿੱਚ, ਆਓ ਜਾਂਚ ਕਰੀਏ: https://www.theslanket.com/robots.txt
# Hello Robots and Crawlers! We're glad you are here, but we would # prefer you not create hundreds and hundreds of carts. User-agent: * Disallow: /cgi-bin/UCEditor Disallow: /cgi-bin/UCSearch Disallow: /cgi-bin/UCReviewHelpful Disallow: /cgi-bin/UCMyAccount Disallow: /merchant/signup/signup2Save.do Disallow: /merchant/signup/signupSave.do Crawl-delay: 5 # Sitemap files Sitemap: https://www.theslanket.com/sitemapsdotorg_index.xml
ਇਹ ਵਰਜਿਤ ਨਹੀਂ ਹੈ, ਇਸ ਲਈ ਚਲੋ.
ਉਦੇਸ਼
ਆਓ ਇੱਕ ਬੇਤਰਤੀਬੇ ਉਤਪਾਦ ਤੇ ਵਿਚਾਰ ਕਰੀਏ, ਜਿਵੇਂ https://www.theslanket.com/shop/the-stroller-slanket/TBS-RUBY-WINE.html
ਮੈਂ ਉਨ੍ਹਾਂ 5 ਤੱਤਾਂ ਨੂੰ ਉਜਾਗਰ ਕੀਤਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਅਸੀਂ ਲਾਲ ਰੰਗ ਵਿੱਚ ਰਗੜਾਂਗੇ:
- ਉਤਪਾਦ ਸਿਰਲੇਖ
- ਸਧਾਰਨ ਕੀਮਤ
- ਛੂਟ ਵਾਲੀ ਕੀਮਤ
- ਛੋਟਾ ਵਰਣਨ
- ਐਸ.ਕੇ.ਯੂ
ਕਦਮ 2 - ਸਕ੍ਰੈਪਿੰਗ
ਇੱਕ Node.js ਫਾਈਲ ਬਣਾਉ ਇੱਕ ਨਵੀਂ ਫਾਈਲ ਬਣਾਉ, ਆਓ ਇਸਦਾ ਨਾਮ ਰੱਖੀਏ SlanketScraping.js . ਉਸ ਫਾਈਲ ਨੂੰ ਆਪਣੀ ਨਿਰਧਾਰਤ ਡਾਇਰੈਕਟਰੀ ਵਿੱਚ ਸੁਰੱਖਿਅਤ ਕਰੋ. ਸਾਡੇ ਕੇਸ ਵਿੱਚ, ਇਹ ਪ੍ਰੋਜੈਕਟ 1 ਵਿੱਚ ਹੋਵੇਗਾ.
ਇੱਕ ਬ੍ਰਾਉਜ਼ਰ ਉਦਾਹਰਣ ਬਣਾਉ
(async () => { const browser = await puppeteer.launch() })()
(ਵਿਕਲਪਿਕ) ਆਬਜੈਕਟ ਰਾਹੀਂ ਵਿਕਲਪ ਪਾਸ ਕਰੋ puppeteer.launch () . ਉਸ ਸਥਿਤੀ ਵਿੱਚ, ਆਓ ਕਠਪੁਤਲੀ ਨੂੰ 2 ਵਿਕਲਪ ਦੇਈਏ.
ਸਿਰਹੀਣ : ਇਸ ਵਿਕਲਪ ਵਿੱਚ Chromium ਦਿਖਾਉਣਾ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਕਠਪੁਤਲੀ ਬ੍ਰਾਉਜ਼ ਕਰ ਰਿਹਾ ਹੁੰਦਾ ਹੈ. ਜਿਵੇਂ ਕਿ ਪਹਿਲਾਂ ਪਰਿਭਾਸ਼ਤ ਕੀਤਾ ਗਿਆ ਹੈ, ਕਠਪੁਤਲੀ ਇੱਕ ਸਿਰ ਰਹਿਤ ਕਰੋਮ ਬ੍ਰਾਉਜ਼ਰ ਹੈ. ਪਰ, ਇੱਕ ਸ਼ੁਰੂਆਤੀ ਹੋਣ ਦੇ ਨਾਤੇ, ਮੈਂ ਤੁਹਾਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਕੇ ਅਰੰਭ ਕਰਨ ਦੀ ਸਿਫਾਰਸ਼ ਕਰਦਾ ਹਾਂ (ਵਿੱਚ ਕੰਮ ਕਰਨਾ ਸਿਰ ਰਹਿਤ: ਝੂਠਾ ) ਇਹ ਵੇਖਣ ਲਈ ਕਿ ਕੀ ਹੋ ਰਿਹਾ ਹੈ ਅਤੇ ਡੀਬੱਗ ਕਰੋ. ਤੁਸੀਂ ਇਸਨੂੰ ਹਮੇਸ਼ਾਂ ਬਦਲ ਸਕਦੇ ਹੋ ਸੱਚ , ਅਤੇ ਫਿਰ ਕੁਝ ਵੀ ਦਿਖਾਈ ਨਹੀਂ ਦੇਵੇਗਾ.
ਸਲੋਮੋ : ਸਲੋ-ਮੋਸ਼ਨ ਵਿਕਲਪ ਕਠਪੁਤਲੀ ਨੂੰ ਹੌਲੀ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ. ਇਸਦੀ ਵਰਤੋਂ ਬਹੁਤ ਸਾਰੀਆਂ ਸਥਿਤੀਆਂ ਵਿੱਚ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ, ਪਰ ਇੱਥੇ, ਆਓ ਇਹ ਦੱਸੀਏ ਕਿ ਬ੍ਰਾਉਜ਼ਰ ਕੀ ਕਰ ਰਿਹਾ ਹੈ ਅਤੇ ਸਰਵਰ ਨੂੰ ਪਰੇਸ਼ਾਨ ਕਰਨ ਤੋਂ ਬਚਣ ਲਈ ਇਸਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਾਏਗੀ ... ਅਸੀਂ ਇਸਨੂੰ 250 ਐਮਐਸ (ਮਿਲੀਸਕਿੰਟ) ਤੇ ਸੈਟ ਕਰਾਂਗੇ. ਮੂਲ ਰੂਪ ਵਿੱਚ, slowMo 0 ms ਤੇ ਸੈਟ ਕੀਤਾ ਜਾਵੇਗਾ, ਇਸ ਲਈ ਪੂਰੀ ਸਪੀਡ.
(async () => { const browser = await puppeteer.launch({ headless: false, slowMo: 250, }) })()
ਅੱਗੇ, ਅਸੀਂ ਉਪਯੋਗ ਕਰਾਂਗੇ ਨਵਾਂ ਪੰਨਾ () ਪ੍ਰਾਪਤ ਕਰਨ ਦਾ ਤਰੀਕਾ ਪੰਨਾ ਵਸਤੂ. ਜੇ ਤੁਸੀਂ ਅੰਦਰ ਕੰਮ ਕਰਦੇ ਹੋ ਸਿਰ ਰਹਿਤ: ਝੂਠਾ , ਤੁਹਾਨੂੰ ਇੱਕ ਨਵੀਂ ਟੈਬ ਦਿਖਾਈ ਦੇਵੇਗੀ.
(async () => { const browser = await puppeteer.launch({ headless: false, slowMo: 250, }) const page = await browser.newPage() })()
ਤੁਹਾਨੂੰ ਕੀ ਵੇਖਣਾ ਚਾਹੀਦਾ ਹੈ
ਅੱਗੇ, ਅਸੀਂ ਉਹ URL ਪਾਸ ਕਰਾਂਗੇ ਜਿਸਨੂੰ ਅਸੀਂ ਖੁਰਚਣਾ ਚਾਹੁੰਦੇ ਹਾਂ. ਅਜਿਹਾ ਕਰਨ ਲਈ, ਆਓ ਪੇਜ ਨੂੰ ਲੋਡ ਕਰਨ ਲਈ ਪੇਜ ਆਬਜੈਕਟ 'ਤੇ ਗੋਟੋ () ਵਿਧੀ ਨੂੰ ਕਾਲ ਕਰੀਏ.
const puppeteer = require('puppeteer'); (async () => { const browser = await puppeteer.launch({ headless: false, slowMo: 250, }) const page = await browser.newPage() await page.goto('https://www.theslanket.com/shop/the-stroller-slanket/TBS-RUBY-WINE.html') browser.close() })()
ਇੱਥੇ ਅਸੀਂ ਕਠਪੁਤਲੀ ਨੂੰ ਲਾਂਚ ਕੀਤਾ, ਅਤੇ ਉਸ ਖਾਸ ਉਤਪਾਦ ਤੇ ਗਏ ਜਿਸਨੂੰ ਅਸੀਂ ਖੁਰਚਣਾ ਚਾਹੁੰਦੇ ਹਾਂ, ਫਿਰ ਬ੍ਰਾਉਜ਼ਰ ਨੂੰ ਬੰਦ ਕਰ ਦਿੱਤਾ. ਇਸ ਪੜਾਅ 'ਤੇ, ਅਸੀਂ ਸਿਰਫ ਬ੍ਰਾਉਜ਼ ਕਰਨ ਤੋਂ ਇਲਾਵਾ ਕੁਝ ਵੀ ਨਹੀਂ ਖੁਰਕਿਆ.
ਆਓ ਉਨ੍ਹਾਂ 5 ਤੱਤਾਂ ਨੂੰ ਖੁਰਚਾਈਏ ਜਿਨ੍ਹਾਂ ਦਾ ਅਸੀਂ ਪਹਿਲਾਂ ਵਰਣਨ ਕੀਤਾ ਹੈ.
ਕੁਇਲ ਰਿਚ ਟੈਕਸਟ ਐਡੀਟਰ
ਪੰਨੇ ਦੀ ਸਮਗਰੀ ਪ੍ਰਾਪਤ ਕਰੋ
ਜਦੋਂ ਇੱਕ ਪੰਨਾ ਇੱਕ URL ਨਾਲ ਲੋਡ ਹੁੰਦਾ ਹੈ, ਤਾਂ ਅਸੀਂ ਪੜਤਾਲ() ਪੰਨੇ ਦੀ ਸਮਗਰੀ ਪ੍ਰਾਪਤ ਕਰਨ ਦਾ ਤਰੀਕਾ.
const puppeteer = require('puppeteer'); (async () => { const browser = await puppeteer.launch({ headless: false, slowMo: 250, }) const page = await browser.newPage() await page.goto('https://www.theslanket.com/shop/the-stroller-slanket/TBS-RUBY-WINE.html') const results = await page.evaluate(() =>{ //... elements to scrape }) browser.close() })()
ਦੇ ਅੰਦਰ ਪੜਤਾਲ() ਵਿਧੀ, ਅਸੀਂ ਉਸ ਤੱਤ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਵਾਂਗੇ ਜਿਸਨੂੰ ਅਸੀਂ ਖੁਰਚਣਾ ਚਾਹੁੰਦੇ ਹਾਂ, ਖਾਸ ਵਰਤੋਂ ਕਰਕੇ ਚੋਣਕਾਰ .
ਸਹੀ ਚੋਣਕਰਤਾਵਾਂ ਨੂੰ ਲੱਭਣਾ ਕਈ ਵਾਰ ਮੁਸ਼ਕਲ ਹੋ ਸਕਦਾ ਹੈ. ਜੇ ਤੁਹਾਨੂੰ ਚੋਣਕਰਤਾਵਾਂ ਬਾਰੇ ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਦੀ ਜ਼ਰੂਰਤ ਹੈ, ਤਾਂ ਮੈਂ ਤੁਹਾਨੂੰ ਉਸ ਵਿਸ਼ੇ ਬਾਰੇ ਹੇਠਾਂ ਦਿੱਤੇ ਦਸਤਾਵੇਜ਼ਾਂ ਨੂੰ ਪੜ੍ਹਨ ਦੀ ਸਿਫਾਰਸ਼ ਕਰਦਾ ਹਾਂ. ਮੇਰੇ ਤੇ ਵਿਸ਼ਵਾਸ ਕਰੋ, ਤੁਹਾਨੂੰ ਇਸਦੀ ਜ਼ਰੂਰਤ ਹੋਏਗੀ.
https://developer.mozilla.org/en-US/docs/Web/API/Document/querySelector
ਸਾਡੇ ਚੋਣਕਾਰ ’ਤੇ ਵਾਪਸ ਜਾਓ। ਸਭ ਤੋਂ ਵਧੀਆ ਅਭਿਆਸ, ਮੈਂ ਸਿਫਾਰਸ਼ ਕਰਾਂਗਾ, ਆਪਣੇ ਚੋਣਕਾਰਾਂ ਨੂੰ ਪਰਿਭਾਸ਼ਤ ਕਰਨ ਅਤੇ ਪਰਖਣ ਲਈ ਗੂਗਲ ਕਰੋਮ ਕੰਸੋਲ ਦੀ ਵਰਤੋਂ ਕਰਨਾ. ਕੰਸੋਲ ਖੋਲ੍ਹਣ ਲਈ:
- ਨਿਸ਼ਾਨਾ ਖੋਲ੍ਹੋ Chrome ਵਿੱਚ URL
- ctrl+ਕਲਿਕ ਕਰੋ ਇੱਕ ਖਾਸ ਤੱਤ ਤੇ ਜਿਸਨੂੰ ਤੁਸੀਂ ਖੁਰਕਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਆਓ ਉਤਪਾਦ ਸਿਰਲੇਖ ਨਾਲ ਅਰੰਭ ਕਰੀਏ, ਅਤੇ
- ਚੁਣੋ ਜਾਂਚ ਕਰੋ
ਇੱਕ ਕਾਲਾ ਪੈਨਲ ਬੁਲਾਇਆ ਗਿਆ ਤੱਤ ਤੁਹਾਡੇ ਪੰਨੇ ਦੇ ਸੱਜੇ ਪਾਸੇ, ਤੁਹਾਡੇ ਦੁਆਰਾ ਕਲਿਕ ਕੀਤੇ ਤੱਤ ਦੀ ਸਹੀ ਸਥਿਤੀ ਤੇ ਖੁੱਲ੍ਹ ਰਿਹਾ ਹੈ.
ਗੂਗਲ ਕਰੋਮ> ਸਿਰਲੇਖ ਤੇ ਕਲਿਕ ਕਰਕੇ ਤੱਤ ਦੀ ਜਾਂਚ ਕਰੋ
ਇੱਥੇ, ਸਾਡਾ ਤੱਤ ਸ਼ਾਮਲ ਕੀਤਾ ਗਿਆ ਹੈ
ਸਿਰਲੇਖ ਜਿਸਦੀ ਅਸੀਂ ਭਾਲ ਕਰ ਰਹੇ ਹਾਂ ਉਹ ਹੈ: ਸਟਰਲਰ ਸਲਿਮ - ਰੂਬੀ ਵਾਈਨ , | _+_ | ਵਿੱਚ ਸ਼ਾਮਲ.
ਇਸ ਲਈ, ਆਓ ਇਸਨੂੰ ਸਿੱਧਾ ਗੂਗਲ ਕਰੋਮ ਕੰਸੋਲ ਵਿੱਚ ਚੁਣਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੀਏ. ਐਲੀਮੈਂਟਸ ਪੈਨਲ ਦੇ ਨਾਲ, ਕੰਸੋਲ ਟੈਬ ਤੇ ਕਲਿਕ ਕਰੋ.
ਸਮੱਗਰੀ UI ਫਾਈਲ ਅਪਲੋਡ
ਜਵਾਬ ਖਾਲੀ ਹੈ:.
ਨਤੀਜਾ ਖਾਲੀ ਹੈ ...
ਲਾਹਨਤ, ਅਸੀਂ ਅਸਫਲ ਹੋਏ.
ਆਓ ਮਾਪਿਆਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੀਏ div , ਹੇਠ ਲਿਖੇ ਅਨੁਸਾਰ
document.querySelector('.text').innerText
ਇਹ ਹੈ ਸਾਡਾ ਸਿਰਲੇਖ!
ਇਸ ਲਈ, ਇਹ ਚੋਣਕਾਰ ਸਾਨੂੰ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਕੰਮ ਕਰ ਰਿਹਾ ਹੈ ਉਤਪਾਦ ਸਿਰਲੇਖ ਉਤਪਾਦ ਦੇ.
ਆਓ ਆਪਣੇ ਕੋਡ ਵਿੱਚ ਚੋਣਕਾਰ ਨੂੰ ਸ਼ਾਮਲ ਕਰੀਏ ਇਹ ਵੇਖਣ ਲਈ ਕਿ ਕੀ ਕਠਪੁਤਲੀ ਇਸਨੂੰ ਖੁਰਚ ਸਕਦਾ ਹੈ.
document.querySelector('.widget.widget-itemtitle ').innerText
ਵਿਜ਼ੁਅਲ ਸਟੂਡੀਓ ਕੋਡ ਵਿੱਚ, ਆਪਣੀ ਪ੍ਰੋਜੈਕਟ 1 ਡਾਇਰੈਕਟਰੀ ਵਿੱਚ, ਚਲਾਓ:
const puppeteer = require('puppeteer'); (async () => { const browser = await puppeteer.launch({ headless: false, slowMo: 250, }) const page = await browser.newPage() await page.goto('https://www.theslanket.com/shop/the-stroller-slanket/TBS-RUBY-WINE.html') const results = await page.evaluate(() =>{ //our new selector return document.querySelector('.widget.widget-itemtitle ').innerText; }) //log results at the screen console.log(results) browser.close() })()
ਵਿਜ਼ੁਅਲ ਸਟੂਡੀਓ ਕੋਡ ਨੂੰ ਲੌਗ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ
node SlanketScraping.js
ਆਓ ਸਿਰਲੇਖ ਨੂੰ ਖੁਰਕਣ ਲਈ ਵਰਤੇ ਜਾਣ ਦੀ ਬਜਾਏ ਉਸੇ ਵਿਧੀ ਦੇ ਅਨੁਸਾਰ ਹੋਰ ਤੱਤ ਸ਼ਾਮਲ ਕਰੀਏ. ਕਿਉਂਕਿ ਅਸੀਂ ਕਈ ਤੱਤਾਂ ਨੂੰ ਖੁਰਚ ਰਹੇ ਹਾਂ, ਅਸੀਂ ਪੰਜ ਤੱਤਾਂ ਵਾਲੇ ਵਸਤੂ ਨੂੰ ਪਰਿਭਾਸ਼ਤ ਕਰਾਂਗੇ.
ਇੱਥੇ 5 ਤੱਤ ਚੋਣਕਾਰ ਹਨ:
The Stroller Slanket - Ruby Wine
ਪੂਰਾ ਕੋਡ
ਸਾਡੀ ਉਦਾਹਰਣ ਦਾ ਪੂਰਾ ਕੋਡ ਇਹ ਹੈ.
ProductTitle: document.querySelector('.widget.widget-itemtitle ').innerText, NormalPrice: document.querySelector('.price').innerText, DiscountedPrice: document.querySelector('.price.sale').innerText, ShortDescription: document.querySelector('.widget-itemdescription-excerpt').innerText, SKU: document.querySelector('.widget.widget-itemsku ').innerText,
ਕੂਪੋਲ ਬਾਰੇ
ਇਸ ਲੇਖ ਦਾ ਉਦੇਸ਼ ਤੁਹਾਨੂੰ ਕਠਪੁਤਲੀ ਦੀ ਵਰਤੋਂ ਕਰਦਿਆਂ ਇੱਕ ਬਹੁਤ ਹੀ ਪਹਿਲੀ ਅਤੇ ਸਧਾਰਨ ਸਕ੍ਰੈਪਿੰਗ ਕਸਰਤ ਪੇਸ਼ ਕਰਨਾ ਹੈ.
ਭਵਿੱਖ ਵਿੱਚ, ਮੈਂ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਵੈਬ ਸਕ੍ਰੈਪਿੰਗ ਮਿਸ਼ਨਾਂ ਨੂੰ ਪ੍ਰਕਾਸ਼ਤ ਕਰਾਂਗਾ.
ਮੈਨੂੰ ਉਮੀਦ ਹੈ ਕਿ ਤੁਸੀਂ ਕੁਝ ਚੀਜ਼ਾਂ ਸਿੱਖੀਆਂ ਹੋਣਗੀਆਂ, ਅਤੇ ਇਹ ਤੁਹਾਡੀ ਵੈਬ ਸਕ੍ਰੈਪਿੰਗ ਦੇ ਹੁਨਰ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਅਤੇ ਬਿਹਤਰ ਬਣਾਉਣ ਵਿੱਚ ਤੁਹਾਡੀ ਸਹਾਇਤਾ ਕਰੇਗੀ.
ਉਂਜ…
ਤੇ ਕੂਪੋਲ ਅਸੀਂ ਚਾਹੁੰਦੇ ਹਾਂ ਕਿ ਹਰ ਕੋਈ ਖੁਰਕਣ ਦੇ ਯੋਗ ਹੋਵੇ. ਜਿਵੇਂ ਕਿ ਪਹਿਲਾਂ ਹੀ ਕਿਹਾ ਗਿਆ ਹੈ, ਇਹ ਵੱਖ ਵੱਖ ਪ੍ਰੋਜੈਕਟਾਂ ਵਿੱਚ ਉਪਯੋਗੀ ਹੋ ਸਕਦਾ ਹੈ. ਇਸ ਲਈ, ਜੇ ਇਹ ਤੁਹਾਡੀ ਦਿਲਚਸਪੀ ਰੱਖਦਾ ਹੈ, ਤੁਹਾਡੀ ਮੌਜੂਦਾ ਨੌਕਰੀ ਨਾਲ ਕੋਈ ਫਰਕ ਨਹੀਂ ਪੈਂਦਾ, ਸਾਨੂੰ ਇੱਕ ਈਮੇਲ ਭੇਜਣ ਵਿੱਚ ਕਦੇ ਵੀ ਸੰਕੋਚ ਨਾ ਕਰੋ ( [email protected] ). ਅਸੀਂ ਤੁਹਾਨੂੰ ਮਿਲ ਕੇ ਵਧੇਰੇ ਖੁਸ਼ ਹੋਵਾਂਗੇ, ਅਤੇ ਕੌਣ ਜਾਣਦਾ ਹੈ, ਸ਼ਾਇਦ ਮਿਲ ਕੇ ਕੰਮ ਕਰਾਂ?
ਸੁਰੱਖਿਅਤ rapeੰਗ ਨਾਲ ਖੁਰਚੋ.
#nodejs #javascript #Puppeteer #node-js