• Kobiety Biznesu
  • Kobiety Showbiznesu
  • Ikony
  • Warto odwiedzić
  • Warto mieć
  • Biznes
  • Newsy
  • Kontakt
  • Regulamin
Sukces jest kobietą!
  • Kobiety
    • B01A1455 poziom fotograf
      Agnieszka Owczarek-Cząstka: Wartości, wizja i wytrwałość
    • Lucyna Janik foto
      Lucyna Janik dołączyła do projektu #SukcesJestKobietą
    • Alina poziom
      Alina Szynaka: Motywuje mnie odpowiedzialność za rozwój firmy!
    • B01A9618 Joanna poziom1
      Pokora i respekt kreują własną markę!
    • BeataPotoczna poziom
      Beata Potoczna w projekcie #SukcesJestKobietą
    • Kobiety Showbiznesu
    • Kobiety Biznesu
    • Ikony
  • Biznes
    • ikona1234praca7
      Cyberbezpieczeństwo na rynku pracy
    • B01A9601 poziom
      Szczerość w komunikacji to klucz do sukcesu!
    • kobieta sukcesu w biznesie
      Spółka czy jednoosobowa działalność? Co wybrać?
    • ciaza
      Ciąża i macierzyństwo a działalność gospodarcza
    • Renata poziom 5
      Renata Zielezińska: Zalety wirtualnej asystentki
    • W teorii
    • W praktyce
  • Dla Ciebie
    • nastolatka
      Słabe narkotyki? Nie istnieją!
    • kobieta 001
      Jak rozpoznać depresję u nastolatka
    • kleszcz 1 1
      Co musisz wiedzieć o kleszczach?
    • ikona1234zdrowie.leki3
      O interakcjach leków z żywnością
    • mezczyznaikonynowe123
      Przerzuty nowotworowe w kościach się leczy?
    • Moda
    • Design
    • Zdrowie
    • Uroda
  • Warto
    • Rubin poziom1
      Hotel Rubinstein w Krakowie zaprasza na Boże Ciało
    • gimnastyka w biurze
      Kiedy dojrzewanie zaczyna się za szybko
    • facebook tabletki
      Problem nastoletniej przemocy w social mediach
    • psiak i dziecko
      Dawkuj dziecku urządzenia cyfrowe!
    • GMLifestyle13
      Bezpieczny powrót do domu
    • Warto mieć
    • Warto odwiedzić
    • Warto przeczytać
  • Newsy
    • wilno
      W Wilnie chłodnik doczekał się własnej parady
    • koloryowocow ikona
      Cytrusy i leki to złe połączenie
    • Hotel Bialowieza macnowphoto.pl 2
      Wykorzystaj bon turystyczny w Białowieży!
    • wlosypawie123
      Dietą powstrzymasz siwienie włosów?
    • ból głowy 1
      Można mieć zawał serca i o tym nie wiedzieć?
    • Wydarzenia
    • Ciekawostki
  • Więcej
    • Kontakt
    • Regulamin
  • Facebook

  • RSS

Ciekawostki

Algorytm wykryje fake newsy na podstawie stylu

Algorytm wykryje fake newsy na podstawie stylu
Sylwia Cukierska
27 grudnia 2021

Nad algorytmem, który na podstawie cech stylistycznych tekstu informacyjnego wykryje, czy jest on fałszywy lub zmanipulowany, pracuje dr inż. Piotr Przybyła z PAN. Jego zespół chce w ten sposób nie tylko wykrywać fake newsy, ale też boty w mediach społecznościowych.

Algorytmy, które wykrywają zmanipulowane lub szkodliwe treści, nie są nowością. Korzystają z nich na przykład media społecznościowe, takie jak Facebook czy Twitter. Jednak wielkie korporacje niechętnie dzielą się informacjami, na jakiej zasadzie one pracują.

„Brakuje w tej kwestii transparentności z ich strony” – uważa dr inż. Piotr Przybyła z Instytutu Podstaw Informatyki PAN. Zespół pod jego kierownictwem zajął się budową algorytmu, który jest w dużej mierze nowatorski, bo do tej pory naukowcy skupiali się na analizie prawdziwości faktów podanych w treści. Przybyła stwierdził, że warto przyjrzeć się stylowi tekstów udostępnianych online, w formie artykułów newsowych i postów w mediach społecznościowych.

„Chcemy sprawdzić, jaka będzie wydajność oceny wiarygodności dokumentu na podstawie cech czysto stylistycznych” – dodał.

Podkreśla, że jego celem jest stworzenie takiego algorytmu, który nie tylko wykryje fake newsy (które są najbardziej jaskrawym przykładem zmanipulowanych treści), ale też innych technik propagandowych i botów.

W jaki sposób powstaje algorytm opracowywany przez badacza? Najpierw jego zespół zebrał dużą bazę anglojęzycznych tekstów (ok. 100 tys.), które pochodzą m.in. od organizacji zajmujących się weryfikacją faktów (tzw. organizacje fact-checkingowe). Jednocześnie algorytm otrzymał informacje o tym, jakich cech użyć do rozróżniania tekstów wiarygodnych i niewiarygodnych.

„Nasz model uczenia maszynowego w pewnym sensie uczy się sam – podajemy mu dane wejściowe z określonym etykietowaniem oraz cechy, które opisują te dane. Następnie do algorytmu należy podjęcie decyzji dotyczącej powiązania cech z wiarygodnością” – opisuje.

Jako największą trudność naukowiec wskazuje kontrolę tego procesu. „Może być tak, że pomimo naszych starań algorytm będzie się kierował przesłankami, którymi wolelibyśmy, by się nie kierował” – dodaje.

Wskazuje, że jako treści wiarygodne określono na przykład informacje BBC. „Ale nie chcielibyśmy, by nasz algorytm uznawał za prawdziwe tylko takie newsy, które napisane są w stylistyce tego konkretnego brytyjskiego nadawcy” – mówi.

Dr Przybyła wskazuje, że wiele tekstów niewiarygodnych w anglojęzycznych mediach dotyczy polaryzacji politycznej w USA. W wielu z nich pojawiają się nazwiska prezydentów Donalda Trumpa i Baracka Obamy. Dlatego, aby algorytm działał lepiej i nie był do takich słów „uprzedzony”, Przybyła usunął je z tekstów przekazanych algorytmowi. Liczy, że w ten sposób dane przekazane do dalszej analizy będą bardziej zobiektywizowane – algorytm otrzyma informacje, że np. zdanie składa się z przymiotnika, rzeczownika, przysłówka, czasownika i w ten sposób będzie ślepy na informacje, które badacze chcą odfiltrować, bo zaburzają pracę algorytmu.

Naukowcy sami narzucili algorytmowi kategorie słów, które ma on uwzględniać, po to, aby łatwiej dało się kontrolować jego działanie. Zaobserwowano trzy główne stylistyczne kategorie informacji niewiarygodnych. Po pierwsze to słowa opisujące osąd i dotyczące wartości i celów moralnych. Po drugie to słowa opisujące władzę, szacunek i wywieranie wpływu. Trzecia grupa to słowa silnie nacechowane emocjami – zarówno pozytywnymi, jak i negatywnymi.

Z kolei wiarygodne teksty powołują się na inne źródła i przedstawiają liczne dane.

„Oczywiście to bardzo duże uproszczenie, bo w sumie wyróżniliśmy ponad 900 cech, którymi kieruje się nasz algorytm” – dodaje.

Przybyła skupił się na testowaniu metody dla języka angielskiego, bo jest on znany wszystkim badaczom zajmującym się tą dziedziną. „Łatwiejszy jest też dostęp do dużej liczby dobrze opracowanych i sprawdzonych danych, co usprawnia naszą pracę” – zauważa. Dopiero w dalszej kolejności – gdy założenia modelu okażą się słuszne – będzie można stworzyć analogiczny algorytm dla innych języków, w tym polskiego.

Algorytm radzi sobie już w 80-90 proc., ale taka skuteczność nie jest dla badacza zadowalająca. Dlatego dalej trwają pracę nad jego udoskonalaniem. Kolejnym etapem projektu będzie testowanie jego działania na użytkownikach internetu. Naukowcy chcą sprawdzić, jak będzie on wpływał na postrzeganie wiarygodności treści przez człowieka.

Zdaniem dr. Przybyły nie warto łączyć tego algorytmu z innymi, tak aby powstał „superalgorytm”. „Użytkownik musi wiedzieć, na jakiej podstawie maszyna podejmuje decyzje. To musi być transparentne. Gdy nie będzie, wtedy może nie mieć do niej zaufania” – zaznacza.

Przybyła jest przeciwny zautomatyzowaniu działania algorytmu – na przykład w postaci odcinania użytkownika od treści uznanych przez niego za fałszywe. Taką decyzję powinien podjąć jednak sam człowiek – podkreśla.

Projekt dr. Przybyły HOMADOS jest sfinansowany przez Narodową Agencję Wymiany Akademickiej w ramach „Polskich Powrotów”.

PAP – Nauka w Polsce, Szymon Zdziebłowski

szz/ ekr/

Related Itemsdezinformacjafake newsynewsynieprawdziwe informacje
Ciekawostki
27 grudnia 2021
Sylwia Cukierska

Każda kobieta chce być piękna, a my, z pomocą Sylwii podpowiadamy, jak to zrobić. Kosmetyki, zabiegi, a może domowe spa? Polecamy nasz dział „URODA”.

Related Itemsdezinformacjafake newsynewsynieprawdziwe informacje

More in Ciekawostki

koloryowocow ikona

Cytrusy i leki to złe połączenie

Magda Nowak30 maja 2025
Read More
Hotel Bialowieza macnowphoto.pl 2

Wykorzystaj bon turystyczny w Białowieży!

Michal Karas29 maja 2025
Read More
wlosypawie123

Dietą powstrzymasz siwienie włosów?

Kalina Samek25 maja 2025
Read More
ból głowy 1

Można mieć zawał serca i o tym nie wiedzieć?

Ela Prochowicz23 maja 2025
Read More
GM Lifestyle8

Dlaczego dom jest skarbnicą wiedzy o człowieku?

Edyta Nowicka20 maja 2025
Read More
ikona1234sport.ludzie.zdrowie3

Triki na aktywne życie z bolącymi stawami

Magda Dzik-Kordas14 maja 2025
Read More
ikona1234kobieta

Uczulenie na jad owadów a psychika

Dagna.Starowieyska12 maja 2025
Read More
ikona123lek.zdrowie

Tran dla wegan? Suplementacja zgodna z przekonaniami

Dagna.Starowieyska27 kwietnia 2025
Read More
Pałac Mortęgi - tu historia żyje do dziś

O tym jak wieś Mortęgi załaskotała Krzyżaków

Michal Karas20 kwietnia 2025
Read More
Scroll for more
Tap

Polecane

  • ikona1234praca7
    Cyberbezpieczeństwo na rynku pracy
    W praktyce17 maja 2025
  • B01A9601 poziom
    Szczerość w komunikacji to klucz do sukcesu!
    W praktyce8 maja 2025
  • kobieta sukcesu w biznesie
    Spółka czy jednoosobowa działalność? Co wybrać?
    W praktyce8 maja 2025

Facebook

Copyright © 2015 PressFactory Sp. z o.o., Stworzone przez G-marketing Regulamin

Ta strona używa ciasteczek (cookies), dzięki którym nasz serwis może działać lepiej. Rozumiem Dowiedz się więcej
Prywatność i polityka ciasteczek

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Necessary
Always Enabled
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Non-necessary
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.
SAVE & ACCEPT
Go to mobile version