Wikipedysta:Cackoarek/brudnopis: Różnice pomiędzy wersjami
Usunięta treść Dodana treść
m MalarzBOT: zmiana szablonu {{Artysta muzyczny infobox}} na {{Zespół muzyczny infobox}} |
mNie podano opisu zmian |
||
Linia 1:
{{Oprogramowanie infobox
|nazwa = OSA
|rodzaj = Otwarty System Antyplagiatowy
|logo =
|grafika =
|opis grafiki =
|autor = [http://www.osaweb.pl Otwarty System Antyplagiatowy]
|platforma sprzętowa =
|system operacyjny = [[FreeBSD]], [[OS X]], [[Linux]], [[Microsoft Windows|Windows]]
|język programowania = [[java]]
|technologie = [[PostgreSQL]], [[MongoDB]], [[Nginx]], [[Apache_Tomcat]]
|pierwsze wydanie = {{Dts|17|12|2012}} <ref name="osaweb">{{cytuj stronę| url =http://muci.edu.pl/archiwum.htm | tytuł = Międzyuniwersyteckie Centrum Informatyzacji | język =pl}}</ref>
|wersja stabilna = 3.3.3 - {{Data wydania|2015|09|03}}
|wersja testowa = 3.4.0 - {{Data wydania|2015|10|20}}
|licencja =
|wikibooks =
|commons =
|www = http://www.osaweb.pl
}}
'''OSA''' (Otwarty System Antyplagiatowy) – jest polskim systemem antyplagiatowym, który powstał w ramach projektu realizowanego przez [[konsorcjum]] [[Międzyuniwersyteckie Centrum Informatyzacji]] (MUCI) przy współpracy z [[Instytut_Podstaw_Informatyki_PAN|Instytutem Podstaw Informatyki Polskiej Akademii Nauk]] (IPI PAN)<ref name="osaweb">{{cytuj stronę| url =http://www.osaweb.pl | tytuł = Otwarty System Antyplagiatowy| język =pl}}</ref>. Stosowany jest na wyższych [[Uczelnia|uczelniach]] w toku przyznawania [[Tytuł zawodowy| tytułów zawodowych]] oraz [[Stopnie naukowe w Polsce|stopni naukowych]] jako narzędzie wskazujące nieuprawnione zapożyczenia w pracy ([[plagiat]]y).
==Cechy==
System OSA, do [[Porównanie|porównania]] tekstów, nie korzysta ze standardowych [[algorytm]]ów znajdowania wspólnych podciągów [[znak]]owych. Dzięki temu nie wymaga to użycia oryginalnej treści pracy, lecz odpowiednich [[Struktura danych|struktur danych]] przechowującymi częściową informację o tekstach jakimi są [[Term frequency|wektory częstości]] i mapy. Zaletami takiego podejścia są:
# Dane na jakich pracuje OSA mają cechy [[Funkcja skrótu|skrótu]] - t. zn. nie można z nich odtworzyć oryginalnych treści prac,
# Proces porównania map zgromadzonych w [[Baza danych|bazie danych]] jest wystarczający do wskazania zapożyczeń pomiędzy badanymi dokumentami. Podejście to odznacza się lepszą [[Złożoność obliczeniowa|efektywnością]] niż tradycyjne porównywanie oryginalnych tekstów dwóch prac. Dzięki temu uzyskuje się większą odporność na powszechnie stosowane sposoby ukrycia plagiatu (przestawianie szyku lub kolejności zdań, stosowanie [[synonim]]ów, podstawienia czcionek lub tworzenia pracy z kilku źródeł),
# OSA jest w stanie zaindeksować (t.j. utworzyć wektory częstości lub inne skróty nieodwracalne) dowolnie duży zbiór prac referencyjnych. Najczęściej są to zbiory dostarczone przez użytkownika w jednym z formatów tekstowych: txt, rtf, pdf, doc, docx, odt.
W przypadku stwierdzenia zbyt dużego podobieństwa między badaną pracą a referencyjną, OSA dostarcza szereg narzędzi, które pomogą przeanalizować podejrzane treści. Takie badanie takie odbywa się na zbiorze prac dyplomowych danej uczelni jak również w bazie polskojęzycznych [[Strona internetowa|stron internetowych]]. Najczęściej jest to [[zbiór pusty]] lub kilkuelementowy.
==Historia==
OSA powstała jako odpowiedź na coraz bardziej rażące zjawisko [[Plagiat|plagiatowania]] [[Praca dyplomowa|prac dyplomowych]] na polskich uczelniach. Tworzona jest w ramach projektu realizowanego przez Międzyuniwersyteckie Centrum Informatyzacji (MUCI). Chociaż, że na rynku istnieją rozwiązania pozwalające weryfikować [[Oryginalność_dzieła_naukowego|oryginalność]] prac, autorzy zaproponowali narzędzie o całkowicie innej filozofii działania. Projekt współfinansowany jest przez uczelnie wchodzące w skład MUCI, które stają się w pewnym sensie właścicielami OSY oraz mają wpływ na przyszły kształt produktu. W celu polepszenia jakości wykrywania zapożyczeń zawiązano współpracę z IPI PAN - właściciela polskiej [[Semantyka (językoznawstwo)|semantycznej]] [[Wyszukiwarka internetowa NEKST|wyszukiwarki internetowej NEKST]]. W konsekwencji uzyskano możliwość analizy antyplagiatowej w bazie ponad 600 mln stron internetowych bez konieczności generowania zapytań do zewnętrznych podmiotów takich jak [[Google]], [[Yahoo]] itp. Pomimo tak wielkiego zbioru referencyjnego, samo wyszukiwanie zapożyczeń trwa najczęściej mniej niż sekundę.
== Obsługiwane bazy referencyjne ==
OSA współpracuje z następującymi bazami:
* Uczelniane repozytorium prac dyplomowych (importowane np. z APD - [[Uniwersytecki System Obsługi Studiów|USOS]])
* Uczelniane repozytorium prac zaliczeniowych (tworzone w systemie OSA przez studentów i promotorów)
* Baza ponad 600 mln dokumentów internetowych zebranych przez wyszukiwarkę Nekst
* Baza aktów prawnych (zebranych przez [[Wyszukiwarka internetowa NEKST|NEKST]] na stronach ministerstwa)
== Najważniejsze funkcjonalności ==
* Wyszukiwanie plagiatów w bazie referencyjnej
* Wyszukiwanie plagiatów w bazie internetowej poprzez NEKST bez przesyłania oryginału pracy poza serwer uczelni
* Wyliczanie statystyk antyplagiatowych
* Powiadomienia mailowe o zakończonym sprawdzaniu wraz z raportem pdf
* Obsługa wielu typów plików (pdf, doc, docx, rtf, txt, odt)
* Import do bazy prac referencyjnych OSY z dużych plików archiwum
* Obsługa kolekcji - narzędzie do krzyżowego sprawdzania prac zaliczeniowych dla pracowników dydaktycznych
* Autoryzacja użytkownika poprzez login/hasło, [[LDAP]], [[CAS]]
* Pełna dwukierunkowa integracja z systemem USOS w tym integracja z APD
* Multiplatformowość i wielowątkowość systemu
* Szczegółowe porównanie i ujednolicone szczegółowe porównanie - narzędzia do konfrontacji ze sobą dwóch prac mających ze sobą wspólne frazy
* Rozpoznawanie w tekście równań matematycznych, cyfr arabskich, rzymskich, deszyfracji podstawień czcionek
Aktualnie prace trwają nad integracją z:
* [[Ogólnopolskie Repozytorium Pisemnych Prac Dyplomowych|ORPPD]] - dzięki któremu OSA będzie w stanie wykryć plagiaty między pracami utworzonymi na wszystkich polskich uczelniach
* Bazą 10 mln artykułów naukowych, książek i czasopism
==Zobacz
* [[Plagiat]]
* [[Autoplagiat]]
==
* [1] Marek Kowalski, Imitacjai ignorancja, Zeszyty Naukowe Politechniki Rzeszowskiej, vol. 15, pp. 69 – 74, 2008.
* [2] Salha Alzahrani, Naomie Salim, Ajith Abraham Understanding plagiarism linguistic patterns textual features and detection methods, IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS—PART C: APPLICATIONS AND REVIEWS, VOL. XX, NO. XX , pp. 1 – 17, 2011.
* [3] Marek Kowalski, Marek Szczepański, Akademicka przestępczość w cyberprzestrzeni, in Brunon Hołyst, Jacek Pomykała (eds.) Cyberprzestępczość i ochrona informacji, pp. 113 – 126, ISBN 978-83-7520-076-8, 2011.
* [4] Marek Szczepański, Metody porównywania tekstów – analiza częstościowa, in Brunon Hołyst, Jacek Pomykała (eds.) Cyberprzestępczość i ochrona informacji. Bezpieczeństwo w Internecie. Vol II, pp. 329 – 347, ISBN 978-83-7520-131-4, 2013.
* [5] Marek Szczepański, Algorytmy klasyfikacji tekstów i ich wykorzystanie w systemie wykrywania plagiatów, Oficyna Wydawnicza Politechniki Warszawskiej, ISBN 978-83-7814-189-1, 2014.
* [6] Marek Szczepański, Testy skuteczności algorytmu preselekcji Otwartego Systemu Antyplagiatowego, in Brunon Hołyst, Jacek Pomykała, Piotr Potejko (eds.) Nowe techniki badań kryminalistycznych a bezpieczeństwo informacji, pp. 248 – 256, PWN, ISBN/ISSN: 978-83-01-17890-1 , 2014
* [7] Marek Kowalski, Piotr Kruszyński, Ścibór Sobieski, Maciej Sysak, Geneza, architektura i testy otwartego systemu antyplagiatowego,w tomie pod redakcją Brunon Hołyst, Jacek Pomykała, Piotra Potejko (eds.) Nowe techniki badań kryminalistycznych a bezpieczeństwo informacji, pp. 257 – 273, PWN, ISBN/ISSN: 978-83-01-17890-1 , 2014
* [8] Marek Kowalski, Marek Szczepański, Identity of academic theses, in Resemblance and Difference. The Problem of Identity, Teresa Dobrzyńska & Raya Kuncheva eds., Instytut Badań Literackich Polskiej Akademii Nauk, Instytut Literatury Bułgarskiej Akademii Nauk, pp. 259 – 278, ISBN 978-954-8712-97-2, 2015.
{{
== Linki zewnętrzne ==
* [http://muci.edu.pl Międzyuniwersyteckie Centrum Informatyzacji]
* [http://nekst.pl Wyszukiwarka Nekst]
|