Czy tylko ja widze te durne reklamy na p.m.e ?

io snipped-for-privacy@op.pl.invalid> napisał(a):

Po długości tematu, po długości treści, języku, słowach kluczowych taki jak KINDLE. Wystarczy rzut okna na ten spam. Poza tym admin chmurki publikował swoje filtry, można je wziąć jako inspirację.

Reply to
Grzegorz Niemirowski
Loading thread data ...

a a snipped-for-privacy@gmail.com napisał(a):

Znów ta teoria bez dowodów. Pokaż post, o którym wiadomo, że ma zmodyfikowany nagłówek.

Ale gdzie jest ta captcha? Przy wysłaniu każdego posta? Przecież nie. Wystarczy raz ją wpisać. Poza tym można też całkiem tanio wykupić usługę, że ktoś za Ciebie będzie tę captchę rozwiązywać. Obejścia automatyczne też pewnie istnieją. Uczepiłeś się tej captchy tak samo jak tych nagłówków.

Reply to
Grzegorz Niemirowski

a a snipped-for-privacy@gmail.com napisał(a):

Bierzemy pod uwagę kilka cech posta. I jak weźmiesz jednocześnie choćby te dwie: długi temat i długą treść, to prawie na 100% trafisz. Nikt nie pisał, że długi tytuł jest zły. Po prostu jest charakterystyczny dla spamera.

Nie wiem o co Ci chodzi z tym kontrolowaniem. Filtrują admini na swoich serwerach albo użytkownicy w swoich czytnikach.

Reply to
Grzegorz Niemirowski

W dniu 1.12.2023 o 19:45, Jarosław Sokołowski pisze:

Sprawdź chmurkowe statystyki z maja 2023. Na największe grupy wysyłano 300-500 postów. W pl.* to drugi serwer jeśli chodzi o użytkowników liczonych po "From"

Reply to
ttrr

W dniu 01.12.2023 o 18:43, io pisze:

Use language in the topic...Luke :) Sądzę, że na polskich grupach jest

99% tematów po polsku :D Zapewne znacznie większą część spamu odfiltrujesz.
Reply to
LordBluzg®🇵🇱

Nie wiadomo. Ale raczej chodzi o pozycjonowanie tych linków w Google. Nie szukają klientów w Usenecie, po prostu wykorzystują Usenet.

Reply to
Arnold Ziffel

Ale Google przeszukuje Usenet? Myślałem, że tylko www.

Robert

Reply to
Robert Wańkowski

W dniu 02.12.2023 o 17:08, a a pisze:

Czyli głupi, bo nikt tego nie czyta, nie mówić o kliknięciu, a już w ogóle o wejściu do ich wirtualnego kasyna.

Robert

Reply to
Robert Wańkowski

Pan Robert Wańkowski napisał:

Nie przeszukuje Usenetu, ale przeszukuje "Google Groups". To nie to samo. Ten wynalazek ma ze dwadzieścia lat, w zamyśle był listserverem dla list mailowych. I w zasadzie tym pozostał -- stąd nagłówku "X-Received" jest "SMTP". Bramka WWW to sprawa wtórna, została dorobiona później. Ja jestem zapisany do jednej z takich grup od samego jej (i pozostałych) początku. Można powiedzieć, pionierem googlegroupiarzy jestem. To działa do dzisiaj. To znaczy mail wysłany na adres grupy przychodzi (między innymi) do mnie, na mój niegmailowy adres.

Całe archiwum widać pod adresami

formatting link
*, gdzie w miejsce gwiazdki jest nazwa. Niekoniecznie w postaci nazwy usenetowej, jak "pl.misc.elektronika". Nie pamiętam jak odnaleźć listę istniejących grup, kiedyś była łatwo dostępna, teraz może jej w ogóle nie ma w sisci. Wpisałem na pałę "dupa", "polska", "warszawa", "madrid" -- i zobaczyłem zawartość. W pierwszym przypadku brak wiadomości (dupa jest dziewicza), w pozostałych trochę spamu i niespamu z okolic lat 2005-2010.

Wracając do pytania, nie wiem czy spamerów uznać za mądrych, czy głupich, ale wyglądają na mądrzejszych od tych, co dali się wkręcić Googlowi i wierzą w konieczność powiązania Usenetu z Google Group. To tylko Google na początku zasilił swoje Grupy zawartościa archiwów Usenetu i postanowił spamować Usenet bierzącą treścią pojawiających się na tych ich Grupach.

No i sprytni są ci spamerzy. Albo ci, co im sprzedają listy adresów. Googlowy "Usenet" jest dziurawy jak sito, można tutaj spam wysłać po prostu mailem. Oczywiście wydatnie pomogli im pożyteczni idioci, którzy szastali googlowymi linkami http do wiadomości, zamiast jak Pan Bóg przykazał podawać Message-ID. Harvestery podłapały.

Jarek

PS Znalazłem kolejny (poważny dość) sewrwer usenetowy, z którego zniknęły wiadomości z google-groups.googlegroups.com. Może więc jak kilka innych węzłów też się odetnie, to feed do chmurki się urwie i temat przestanie być aktualny.

Reply to
Jarosław Sokołowski

W dniu 2.12.2023 o 18:53, Jarosław Sokołowski pisze:

Komercyjny? Dla nich grupy tekstowe to chyba balast. :)

Reply to
fifi

W dniu 02.12.2023 o 09:59, LordBluzg®🇵🇱 pisze:

Niby jak mam odfiltrować po języku? Poza tym,zapewne w swoim dorobku mam jakiś artykuł z takim tematem. Np jakiś cytat z protokołu. Nie widzę możliwości tak prostego podejścia.

Reply to
io

Robert Wańkowski napisał(a):

  1. podbicie wyceny danej strony za pomocą mnożenia linków do danej strony = więcej kasy z reklam dla właściciela strony
  2. w dawnych książkach anglojęzycznych dot. reklamy i marketingu miałeś gotowy spis grup usenetu na który wg. autorów warto słać "reklamy"
  3. biznes reklamy internetowej jest wyżej wyceniany niż narkobiznes
410 mld usd vs 320 mld
  1. w PL dalej rekrutują do internetowej szeptanki (ten odkurzacz jest wyśmienity, mam taki i wcale się nie psuje!!!), znaczy na świecie jest popyt na takie usługi

Tak że tak.

Reply to
alojzy nieborak

Pan Grzegorz Niemirowski napisał:

Poniekąd każdy ma zmodyfikowany nagłówek -- konkretnie linię "Path". Ta linia *zawsze* tworzona jest przez serwer udostępniający wiadomość. Dopisuje on siebie na początku, a dalej dołącza resztę otrzymaną przez feed. Oczywiście powinien sprawdzić, czy to co wcześniej stało na początku, jest adresem feeda, z którego wiadomość przyszła. Jeśli nie sprawdzi, to sam sobie jest winien -- za ewentualne "fałszerstwa" odpowiada tylko on sam.

Reply to
Jarosław Sokołowski

A ci admini, którzy usuwają i wywalają ten spam? Ile zarabiają?

Reply to
Arnold Ziffel

a a snipped-for-privacy@gmail.com napisał(a):

Np. właśnie Arnold. Dba, żeby nie było spamu na chmurce. Nie widzisz, bo żyjesz w alternatywnej rzeczywistości.

A Ty dalej ze swoją bajką o spamie z tych serwerów. Co Cię w ogóle tak obchodzą Google Groups? Używaj chmurki i zapomnij o tych głupich GG.

Reply to
Grzegorz Niemirowski

Tymczasem polityka u mnie:

formatting link
Jest jakiś pojedynczy spam, ale nie ma tego tajskiego syfu.

Ostatnie logi z filtra antyspamowego, w formie obrazkowej (to tylko trzy ostatnie minuty, w momencie pisania tego postu):

formatting link
NoCeM-y generowane co 5 minut dla tajskiego spamu:

formatting link
I dla innego (inny = obecnie tylko Kindlowy).

formatting link
Te spamy są usuwane z news.chmurka.net i serwerów, które korzystają z tych NoCeM-ów (nie wiem, które korzystają). Google nie korzysta.

Reply to
Arnold Ziffel

W dniu 05.12.2023 o 12:55, a a pisze:

Kilka wiadomości przeczytać, to ok, ale więcej masakra.

Robert

Reply to
Robert Wańkowski

Po alfabecie bardzo prosto.

formatting link
Implementacja na chmurce:

list = decode_header(tostr(hdr))

if len(list) == 0: log("Passing, because list of tokens in header is zero. Header is: %s" % tostr(hdr)) return False

for token in list: if token[1] == None or token[1].lower() != "utf-8": continue

h = token[0].decode("utf-8") for ch in h: if ord(ch) >= 0x0e00 and ord(ch) <= 0x0e7f: log("Header contains Thai characters") return True

Reply to
Arnold Ziffel

Czyli nie po języku tylko po znakach. Jak to zrobić w czytniku?

Reply to
io

Nie wiem. Jakbym miał to zrobić w czytniku, którego używam (tin), to bym poczytał, a jakbym nic nie wyczytał, to bym edytował źródła (w tinie filtrowanie jest w pliku src/filter.c, funkcja filter_articles()).

Reply to
Arnold Ziffel

ElectronDepot website is not affiliated with any of the manufacturers or service providers discussed here. All logos and trade names are the property of their respective owners.