Перейти до вмісту
Пошук в
  • Детальніше...
Шукати результати, які ...
Шукати результати в ...

Парсинг e-mailОВ


ArtemPitov

Recommended Posts

Всем привет 

Назрел такой вопрос - реально ли спарсить e-mail-ы, к примеру нужно спарсить e-mail-ы первых 10-20 сайтов из выдаче goog-лом если они есть.

если есть такие инструменты поделитесь пожалуйста ) 

Надіслати
Поділитися на інших сайтах

Content Downloader в помощь.

Спасибо :-)

Надіслати
Поділитися на інших сайтах

  • 1 month later...

Есть такой вариант для Linux. 

Использовать wget урл_сайта.

Получить текстовый файл, достать из него все уникальные адреса электронной почты, отсортировать и записать результат в файл.Сделать все можно 1 командой.

grep -E -o "\b[a-zA-Z0-9.-]+@[a-zA-Z0-9.-]+\.[a-zA-Z0-9.-]+\b" file.txt | sort -n | uniq > emails.txt

Команда grep достает из файла все email-ы, все сортируется, оставляются только уникальные значения после чего результат записывается в файл. 

 

Если все находится не в одном большом файле, а в нескольких мелких, то склеить все файлы в 1 можно так:

cat file1 file2 file3 > file4
Надіслати
Поділитися на інших сайтах

Створіть аккаунт або увійдіть для коментування

Ви повинні бути користувачем, щоб залишити коментар

Створити обліковий запис

Зареєструйтеся для отримання облікового запису. Це просто!

Зареєструвати аккаунт

Вхід

Уже зареєстровані? Увійдіть тут.

Вхід зараз
  • Зараз на сторінці   0 користувачів

    • Ні користувачів, які переглядиють цю сторінку
×
×
  • Створити...

Important Information

На нашому сайті використовуються файли cookie і відбувається обробка деяких персональних даних користувачів, щоб поліпшити користувальницький інтерфейс. Щоб дізнатися для чого і які персональні дані ми обробляємо перейдіть за посиланням . Якщо Ви натиснете «Я даю згоду», це означає, що Ви розумієте і приймаєте всі умови, зазначені в цьому Повідомленні про конфіденційність.