Python – programowanie sieciowe oraz crawling stron internetowych

Komunikacja sieciowa między urządzenia oparta jest na protokołach wyższych warstw takich jak HTTP(s), które z kolei wykorzystują protokoły niższych warstw jak transportowa i protokół TCP. Im niższe warstwy analizujemy, tym szybciej dochodzimy do miejsca w którym analizujemy gniazda sieciowe. Dla osób związanych z sieciami teleinformatycznymi tego rodzaju programowanie jest niezwykle ciekawe, bo łączy Python’a z sieciami i technologią, którą znają :). 

Programowanie sieciowe

Rozpoczynając przygodę z programowaniem sieciowym w Python z pewnością warto rozpocząć od gniazd sieciowych, a dopiero później poznać niektóre z bibliotek:

  • Scapy – biblioteka do nasłuchiwania ruch sieciowego jak libpcap w C
  • Requests – biblioteka do obsługi komunikacji HTTP

Crawling stron internetowych

Obecnie większość komunikacji w Internecie to HTTP, dlatego analiza tego protokołu może być znacznie łatwiejsza od innych. Do analizy stron internetowych istnieje wiele bibliotek takich jak: 

 

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Wymagane pola są oznaczone *

Time limit is exhausted. Please reload CAPTCHA.