From f7eb3a2d8a4c419c09ad4c30905d02cbe24ac404 Mon Sep 17 00:00:00 2001 From: Wiktor <> Date: Tue, 20 May 2025 16:24:09 +0200 Subject: [PATCH] Pierwsze README --- README.md | 49 +++++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 49 insertions(+) diff --git a/README.md b/README.md index e69de29..ebcf901 100644 --- a/README.md +++ b/README.md @@ -0,0 +1,49 @@ +# ⛔ Blocklisty ICD + +Ten projekt, realizowany przez [Fundację *Internet. Czas działać!*](https://www.internet-czas-dzialac.pl/), ma na celu utrzymanie czarnej listy stron internetowych, które generują niskiej jakości treści i przyczyniają się do obniżenia jakości internetu. + +**⚠️ UWAGA!** Projekt nie zajmuje się ostrzeganiem przed niebezpiecznymi stronami (np. [phishingiem](https://pl.wikipedia.org/wiki/Phishing)). Po listy zwiększania bezpieczeństwo w Internecie odsyłamy na: +- [CERT Polska: Lista Ostrzeżeń](https://cert.pl/lista-ostrzezen/) +- [Phishing Army](https://phishing.army/) + +## 📜 Dostępne listy + +### 🗣️ SEO-bełkot + +SEO-bełkot to praktyka pisania artykułów pod kątem uzyskania jak najwyższej punktacji w wyszukiwarkach internetowych, ale niekoniecznie są wartościowe lub zrozumiałe dla użytkowników. Artykuły seo-bełkotu napisane są w sposób sztuczny i często zawierają nadmierną liczbę słów kluczowych. Kojarzysz te dłuuuuuugie artykuły o niedzielach handlowych, które można byłoby streścić do jednego zdania? To jest właśnie seo-bełkot. + +| Format | Link | +|------------|--------------------------------------------------------------------------------------------------------| +| AdGuard | https://git.internet-czas-dzialac.pl/icd/blocklisty/raw/branch/master/dist/seo-nonsense/adguard.txt | +| uBlacklist | https://git.internet-czas-dzialac.pl/icd/blocklisty/raw/branch/master/dist/seo-nonsense/ublacklist.txt | + +### 🎫 Reflink Spam + +Reflinki to specjalne linki, które pozwalają użytkownikom uzyskiwać wynagrodzenie za polecanie produktów danej firmy. Strony typu "reflink spam" to witryny internetowe, które wykorzystują linki afiliacyjne ([marketing afiliacyjny](https://pl.wikipedia.org/wiki/Marketing_afiliacyjny)) w sposób nieetyczny lub agresywny, aby generować dochody z prowizji. Zazwyczaj są to witryny oferujące tzw. kody rabatowe, które w rzeczywistości nie istnieją. W praktyce jedynie przypisują kod polecenia do właściciela strony – potem kupujesz produkt, a właściciel zarabia za "polecenie" Ci produktu. + +| Format | Link | +|------------|--------------------------------------------------------------------------------------------------------| +| AdGuard | https://git.internet-czas-dzialac.pl/icd/blocklisty/raw/branch/master/dist/reflink-spam/adguard.txt | +| uBlacklist | https://git.internet-czas-dzialac.pl/icd/blocklisty/raw/branch/master/dist/reflink-spam/ublacklist.txt | + +### 🤡 Strony bezużyteczne + +Bezużyteczne strony to typ stron, które nie niosą ze sobą żadnej wartości merytorycznej, ale wyglądają rzetelnie, co często wprowadza użytkowników w błąd. Do tych stron możemy zaliczyć [satyryczne](https://pl.wikipedia.org/wiki/Satyra) gazety, blogi o [pseudonauce](https://pl.wikipedia.org/wiki/Pseudonauka) czy strony [mirrorujące](https://pl.wikipedia.org/wiki/Mirror). + +| Format | Link | +|------------|---------------------------------------------------------------------------------------------------| +| AdGuard | https://git.internet-czas-dzialac.pl/icd/blocklisty/raw/branch/master/dist/useless/adguard.txt | +| uBlacklist | https://git.internet-czas-dzialac.pl/icd/blocklisty/raw/branch/master/dist/useless/ublacklist.txt | + +## ➕ Jak dodać stronę do listy? + +Obecnie projekt znajduje się w wczesnej fazie rozwoju i jedynie członkowie ICD mają możliwość dodawania stron do list blokujących. + +## 🔨 Budowanie listy blokowania z JSONa + +Podczas dodawania nowych pozycji do listy nie ma potrzeby ręcznego jej budowania, ponieważ git hook automatycznie zajmie się tym podczas akcji commita. Jeśli jednak chcesz zbudować listę samodzielnie, możesz skorzystać z konwertera w następujący sposób: + +``` +python3 converter.py --inputfile src/seo-source.json --targetformat adguard --outputfile dist/seo-nonsense/adguard.txt +``` +