Pierwsze README

This commit is contained in:
Wiktor 2025-05-20 16:24:09 +02:00
parent 0ff8286208
commit f7eb3a2d8a

View File

@ -0,0 +1,49 @@
# ⛔ Blocklisty ICD
Ten projekt, realizowany przez [Fundację *Internet. Czas działać!*](https://www.internet-czas-dzialac.pl/), ma na celu utrzymanie czarnej listy stron internetowych, które generują niskiej jakości treści i przyczyniają się do obniżenia jakości internetu.
**⚠️ UWAGA!** Projekt nie zajmuje się ostrzeganiem przed niebezpiecznymi stronami (np. [phishingiem](https://pl.wikipedia.org/wiki/Phishing)). Po listy zwiększania bezpieczeństwo w Internecie odsyłamy na:
- [CERT Polska: Lista Ostrzeżeń](https://cert.pl/lista-ostrzezen/)
- [Phishing Army](https://phishing.army/)
## 📜 Dostępne listy
### 🗣️ SEO-bełkot
SEO-bełkot to praktyka pisania artykułów pod kątem uzyskania jak najwyższej punktacji w wyszukiwarkach internetowych, ale niekoniecznie są wartościowe lub zrozumiałe dla użytkowników. Artykuły seo-bełkotu napisane są w sposób sztuczny i często zawierają nadmierną liczbę słów kluczowych. Kojarzysz te dłuuuuuugie artykuły o niedzielach handlowych, które można byłoby streścić do jednego zdania? To jest właśnie seo-bełkot.
| Format | Link |
|------------|--------------------------------------------------------------------------------------------------------|
| AdGuard | https://git.internet-czas-dzialac.pl/icd/blocklisty/raw/branch/master/dist/seo-nonsense/adguard.txt |
| uBlacklist | https://git.internet-czas-dzialac.pl/icd/blocklisty/raw/branch/master/dist/seo-nonsense/ublacklist.txt |
### 🎫 Reflink Spam
Reflinki to specjalne linki, które pozwalają użytkownikom uzyskiwać wynagrodzenie za polecanie produktów danej firmy. Strony typu "reflink spam" to witryny internetowe, które wykorzystują linki afiliacyjne ([marketing afiliacyjny](https://pl.wikipedia.org/wiki/Marketing_afiliacyjny)) w sposób nieetyczny lub agresywny, aby generować dochody z prowizji. Zazwyczaj są to witryny oferujące tzw. kody rabatowe, które w rzeczywistości nie istnieją. W praktyce jedynie przypisują kod polecenia do właściciela strony potem kupujesz produkt, a właściciel zarabia za "polecenie" Ci produktu.
| Format | Link |
|------------|--------------------------------------------------------------------------------------------------------|
| AdGuard | https://git.internet-czas-dzialac.pl/icd/blocklisty/raw/branch/master/dist/reflink-spam/adguard.txt |
| uBlacklist | https://git.internet-czas-dzialac.pl/icd/blocklisty/raw/branch/master/dist/reflink-spam/ublacklist.txt |
### 🤡 Strony bezużyteczne
Bezużyteczne strony to typ stron, które nie niosą ze sobą żadnej wartości merytorycznej, ale wyglądają rzetelnie, co często wprowadza użytkowników w błąd. Do tych stron możemy zaliczyć [satyryczne](https://pl.wikipedia.org/wiki/Satyra) gazety, blogi o [pseudonauce](https://pl.wikipedia.org/wiki/Pseudonauka) czy strony [mirrorujące](https://pl.wikipedia.org/wiki/Mirror).
| Format | Link |
|------------|---------------------------------------------------------------------------------------------------|
| AdGuard | https://git.internet-czas-dzialac.pl/icd/blocklisty/raw/branch/master/dist/useless/adguard.txt |
| uBlacklist | https://git.internet-czas-dzialac.pl/icd/blocklisty/raw/branch/master/dist/useless/ublacklist.txt |
## Jak dodać stronę do listy?
Obecnie projekt znajduje się w wczesnej fazie rozwoju i jedynie członkowie ICD mają możliwość dodawania stron do list blokujących.
## 🔨 Budowanie listy blokowania z JSONa
Podczas dodawania nowych pozycji do listy nie ma potrzeby ręcznego jej budowania, ponieważ git hook automatycznie zajmie się tym podczas akcji commita. Jeśli jednak chcesz zbudować listę samodzielnie, możesz skorzystać z konwertera w następujący sposób:
```
python3 converter.py --inputfile src/seo-source.json --targetformat adguard --outputfile dist/seo-nonsense/adguard.txt
```