io snipped-for-privacy@op.pl.invalid> napisał(a):
Po długości tematu, po długości treści, języku, słowach kluczowych taki jak KINDLE. Wystarczy rzut okna na ten spam. Poza tym admin chmurki publikował swoje filtry, można je wziąć jako inspirację.
io snipped-for-privacy@op.pl.invalid> napisał(a):
Po długości tematu, po długości treści, języku, słowach kluczowych taki jak KINDLE. Wystarczy rzut okna na ten spam. Poza tym admin chmurki publikował swoje filtry, można je wziąć jako inspirację.
a a snipped-for-privacy@gmail.com napisał(a):
Znów ta teoria bez dowodów. Pokaż post, o którym wiadomo, że ma zmodyfikowany nagłówek.
Ale gdzie jest ta captcha? Przy wysłaniu każdego posta? Przecież nie. Wystarczy raz ją wpisać. Poza tym można też całkiem tanio wykupić usługę, że ktoś za Ciebie będzie tę captchę rozwiązywać. Obejścia automatyczne też pewnie istnieją. Uczepiłeś się tej captchy tak samo jak tych nagłówków.
a a snipped-for-privacy@gmail.com napisał(a):
Bierzemy pod uwagę kilka cech posta. I jak weźmiesz jednocześnie choćby te dwie: długi temat i długą treść, to prawie na 100% trafisz. Nikt nie pisał, że długi tytuł jest zły. Po prostu jest charakterystyczny dla spamera.
Nie wiem o co Ci chodzi z tym kontrolowaniem. Filtrują admini na swoich serwerach albo użytkownicy w swoich czytnikach.
W dniu 1.12.2023 o 19:45, Jarosław Sokołowski pisze:
Sprawdź chmurkowe statystyki z maja 2023. Na największe grupy wysyłano 300-500 postów. W pl.* to drugi serwer jeśli chodzi o użytkowników liczonych po "From"
W dniu 01.12.2023 o 18:43, io pisze:
Use language in the topic...Luke :) Sądzę, że na polskich grupach jest
99% tematów po polsku :D Zapewne znacznie większą część spamu odfiltrujesz.
Nie wiadomo. Ale raczej chodzi o pozycjonowanie tych linków w Google. Nie szukają klientów w Usenecie, po prostu wykorzystują Usenet.
Ale Google przeszukuje Usenet? Myślałem, że tylko www.
Robert
W dniu 02.12.2023 o 17:08, a a pisze:
Czyli głupi, bo nikt tego nie czyta, nie mówić o kliknięciu, a już w ogóle o wejściu do ich wirtualnego kasyna.
Robert
Pan Robert Wańkowski napisał:
Nie przeszukuje Usenetu, ale przeszukuje "Google Groups". To nie to samo. Ten wynalazek ma ze dwadzieścia lat, w zamyśle był listserverem dla list mailowych. I w zasadzie tym pozostał -- stąd nagłówku "X-Received" jest "SMTP". Bramka WWW to sprawa wtórna, została dorobiona później. Ja jestem zapisany do jednej z takich grup od samego jej (i pozostałych) początku. Można powiedzieć, pionierem googlegroupiarzy jestem. To działa do dzisiaj. To znaczy mail wysłany na adres grupy przychodzi (między innymi) do mnie, na mój niegmailowy adres.
Całe archiwum widać pod adresami
Wracając do pytania, nie wiem czy spamerów uznać za mądrych, czy głupich, ale wyglądają na mądrzejszych od tych, co dali się wkręcić Googlowi i wierzą w konieczność powiązania Usenetu z Google Group. To tylko Google na początku zasilił swoje Grupy zawartościa archiwów Usenetu i postanowił spamować Usenet bierzącą treścią pojawiających się na tych ich Grupach.
No i sprytni są ci spamerzy. Albo ci, co im sprzedają listy adresów. Googlowy "Usenet" jest dziurawy jak sito, można tutaj spam wysłać po prostu mailem. Oczywiście wydatnie pomogli im pożyteczni idioci, którzy szastali googlowymi linkami http do wiadomości, zamiast jak Pan Bóg przykazał podawać Message-ID. Harvestery podłapały.
Jarek
PS Znalazłem kolejny (poważny dość) sewrwer usenetowy, z którego zniknęły wiadomości z google-groups.googlegroups.com. Może więc jak kilka innych węzłów też się odetnie, to feed do chmurki się urwie i temat przestanie być aktualny.
W dniu 2.12.2023 o 18:53, Jarosław Sokołowski pisze:
Komercyjny? Dla nich grupy tekstowe to chyba balast. :)
W dniu 02.12.2023 o 09:59, LordBluzg®🇵🇱 pisze:
Niby jak mam odfiltrować po języku? Poza tym,zapewne w swoim dorobku mam jakiś artykuł z takim tematem. Np jakiś cytat z protokołu. Nie widzę możliwości tak prostego podejścia.
Robert Wańkowski napisał(a):
Tak że tak.
Pan Grzegorz Niemirowski napisał:
Poniekąd każdy ma zmodyfikowany nagłówek -- konkretnie linię "Path". Ta linia *zawsze* tworzona jest przez serwer udostępniający wiadomość. Dopisuje on siebie na początku, a dalej dołącza resztę otrzymaną przez feed. Oczywiście powinien sprawdzić, czy to co wcześniej stało na początku, jest adresem feeda, z którego wiadomość przyszła. Jeśli nie sprawdzi, to sam sobie jest winien -- za ewentualne "fałszerstwa" odpowiada tylko on sam.
A ci admini, którzy usuwają i wywalają ten spam? Ile zarabiają?
a a snipped-for-privacy@gmail.com napisał(a):
Np. właśnie Arnold. Dba, żeby nie było spamu na chmurce. Nie widzisz, bo żyjesz w alternatywnej rzeczywistości.
A Ty dalej ze swoją bajką o spamie z tych serwerów. Co Cię w ogóle tak obchodzą Google Groups? Używaj chmurki i zapomnij o tych głupich GG.
Tymczasem polityka u mnie:
Ostatnie logi z filtra antyspamowego, w formie obrazkowej (to tylko trzy ostatnie minuty, w momencie pisania tego postu):
W dniu 05.12.2023 o 12:55, a a pisze:
Kilka wiadomości przeczytać, to ok, ale więcej masakra.
Robert
Po alfabecie bardzo prosto.
list = decode_header(tostr(hdr))
if len(list) == 0: log("Passing, because list of tokens in header is zero. Header is: %s" % tostr(hdr)) return False
for token in list: if token[1] == None or token[1].lower() != "utf-8": continue
h = token[0].decode("utf-8") for ch in h: if ord(ch) >= 0x0e00 and ord(ch) <= 0x0e7f: log("Header contains Thai characters") return True
Czyli nie po języku tylko po znakach. Jak to zrobić w czytniku?
Nie wiem. Jakbym miał to zrobić w czytniku, którego używam (tin), to bym poczytał, a jakbym nic nie wyczytał, to bym edytował źródła (w tinie filtrowanie jest w pliku src/filter.c, funkcja filter_articles()).
ElectronDepot website is not affiliated with any of the manufacturers or service providers discussed here. All logos and trade names are the property of their respective owners.