Otwarty System Antyplagiatowy: Różnice pomiędzy wersjami
[wersja nieprzejrzana] | [wersja przejrzana] |
Usunięta treść Dodana treść
m MalarzBOT: korekta wielkości nagłówków |
m wikizacja, drobne redakcyjne, drobne merytoryczne |
||
Linia 19:
}}
'''OSA''' (Otwarty System Antyplagiatowy) jest polskim systemem antyplagiatowym, który powstał w ramach projektu realizowanego przez [[konsorcjum]] [[Międzyuniwersyteckie Centrum Informatyzacji]] (MUCI) przy współpracy z [[Instytut_Podstaw_Informatyki_PAN|Instytutem Podstaw Informatyki Polskiej Akademii Nauk]] (IPI PAN)<ref name="osaweb">{{cytuj stronę| url =http://www.osaweb.pl | tytuł = Otwarty System Antyplagiatowy| język =pl}}</ref>. Stosowany jest na wyższych [[Uczelnia|uczelniach]] w toku przyznawania [[Stopnie naukowe w Polsce|stopni naukowych]] jako narzędzie wskazujące nieuprawnione zapożyczenia w parcy ([[plagiat]]).
==Cechy==
System OSA, do [[Porównanie|porównania]] tekstów, nie korzysta bezpośrednio z oryginalnej ich postaci, lecz ze [[Struktura danych|struktur danych]] przechowującymi częściową informację o tekstach. Są to tzw. [[Term frequency|wektory częstości]] i mapy. Takie podejście ma trzy zasadnicze zalety.
# Z bazy tych struktur nie można odtworzyć żadnego z tekstów, który posłużył do jej utworzenia.
# Porównanie map w bazie wystarcza do wskazania zapożyczeń między badanymi pracami ze znacznie lepszą [[Złożoność obliczeniowa|efektywnością]] niż porównanie oryginalnych tekstów jeden do jednego.
# Jest możliwość indeksacji wielkich baz prac referencyjnych (np. [[Ogólnopolskie Repozytorium Pisemnych Prac Dyplomowych|ORPPD]]) poprzez wektory częstości lub inne skróty nieodwracalne.
Tworzenie i aktualizacja bazy map ‒ oraz innych baz niezbędnych do funkcjonowania systemu ‒ jest w pełni zautomatyzowane i odbywa się na podstawie przetworzenia wskazanych przez użytkownika plików zapisanych w jednym z następujących formatów zapisu tekstu: txt, pdf, doc, docx, odt, rtf. Dodatkowo w ramach jednej Uczelni system OSA umożliwia dokładniejsze przyjrzenie się oryginałom prac, w odniesieniu do których stwierdził zbyt wysoki poziom podobieństwa ich map. Tekst badanej pracy można porównać, jeden do jednego, z oryginalnym tekstem każdej z podzbioru prac referencyjnych i polskojęzycznych stron internetowych wyselekcjonowanych przez system na bazie podobieństwa map. Zwykle jest to podzbiór pusty lub kilkuelementowy.
==Historia==
OSA powstała w ramach projektu realizowanego przez Międzyuniwersyteckie Centrum Informatyzacji (MUCI) przy współpracy z Instytutem Podstaw Informatyki Polskiej Akademii Nauk, jako odpowiedź na rosnące zjawisko [[Plagiat|plagiatowania]] [[Praca dyplomowa|prac dyplomowych]]. Na polskim rynku istnieje już kilka rozwiązań, które pozwalają weryfikować jakość pracy pod kątem jej [[Oryginalność_dzieła_naukowego|oryginalności]]. Autorzy systemu OSA proponują kolejne narzędzie, którego filozofia działania odbiega od pozostałych rozwiązań. Ideą powstawania OSY jest współfinansowanie projektu przez uczelnie wchodzące w skład MUCI. W pewnym sensie uczelnia taka staje się właścicielem OSY i ma wpływ na to jak będą kształtować się prace nad finalnym produktem.
==Obsługiwane bazy==
OSA współpracuje z następującymi bazami:
* Uczelniane repozytorium prac dyplomowych (importowane np. z APD - [[Uniwersytecki System Obsługi Studiów|USOS]])
* Uczelniane repozytorium prac zaliczeniowych (tworzone w systemie OSA przez studentów i promotorów)
* Baza ponad 600 mln dokumentów internetowych zebranych przez wyszukiwarkę Nekst
* Baza aktów prawnych (zebranych przez
Aktualnie
* [[Ogólnopolskie Repozytorium Pisemnych Prac Dyplomowych|ORPPD]]
* Bazą 10 mln artykułów naukowych, książek i czasopism
==Wydania<ref name="osaweb">{{cytuj stronę| url =http://wiki.osaweb.pl | tytuł = Baza Wiedzy - Otwarty System Antyplagiatowy| język =pl}}</ref>.==
Linia 47 ⟶ 46:
(03.09.2015, wersja produkcyjna, stabilna)
* Pominięcie walidacji typu pracy dla prac przesłanych z USOS'a
* Widoki
===Wersja 3.3.2===
Linia 59 ⟶ 58:
===Wersja 3.3===
(24.07.2015, wersja produkcyjna, stabilna)
* OSA nie wysyła do [[
* Ulepszony algorytm ekstrakcji słów z tekstu
* Reorganizacja interfejsu
Linia 68 ⟶ 67:
(06.07.2015, wersja produkcyjna, stabilna)
* Obsługa plików z rozszerzeniem rar oraz tar podczas dodawania dokumentów do kolekcji,
* Możliwość
===Wersja 3.2===
(26.06.2015, wersja produkcyjna, stabilna)
* Rozbudowana integracja z protokołem [[LDAP]] (w tym także systemem Active Directory)
*
* Raport z linkiem do szczegółów pracy
* Usprawnienia funkcjonalności zgłoszone przez użytkowników
Linia 88 ⟶ 87:
*Dodanie funkcjonalności kolekcji
*Ulepszone kolorowanie tekstu
*Wykonywanie szczegółowego porównania dla dokumentów z internetu na maszynie OSY (nie wymaga wysyłania tekstu pracy) - a nie na maszynie [[
*Rozpoznawanie w tekście liczb arabskich oraz rzymskich
Linia 108 ⟶ 107:
*Podstawowe funkcje manipulacji dokumentami (dodaj, usuń, zatwierdź, ...)
*Wyszukiwanie plagiatów w bazie referencyjnej
*Wyszukiwanie plagiatów w bazie internetowej poprzez
*Wyliczanie statystyk antyplagiatowych
*Generowanie raportu w pdf
*Podstawowa integracja z [[CAS]] i [[LDAP]]
*Obsługa kolekcji
*Szyfrowane połączenie z
*Import masowy plików archiwum
*Obsługa wielu typów plików (pdf, doc, docx, rtf, txt, odt)
==Zobacz też==
* [[Plagiat]]
* [[Autoplagiat]]
==Publikacje==
* [1] Marek Kowalski, Imitacjai ignorancja, Zeszyty Naukowe Politechniki Rzeszowskiej, vol. 15, pp. 69 – 74, 2008.
* [2] Salha Alzahrani, Naomie Salim, Ajith Abraham Understanding plagiarism linguistic patterns textual features and detection methods, IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS—PART C: APPLICATIONS AND REVIEWS, VOL. XX, NO. XX , pp. 1 – 17, 2011.
* [3] Marek Kowalski, Marek Szczepański, Akademicka przestępczość w cyberprzestrzeni, in Brunon Hołyst, Jacek Pomykała (eds.) Cyberprzestępczość i ochrona informacji, pp. 113 – 126, ISBN 978-83-7520-076-8, 2011.
* [4] Marek Szczepański, Metody porównywania tekstów – analiza częstościowa, in Brunon Hołyst, Jacek Pomykała (eds.) Cyberprzestępczość i ochrona informacji. Bezpieczeństwo w Internecie. Vol II, pp. 329 – 347, ISBN 978-83-7520-131-4, 2013.
* [5] Marek Szczepański, Algorytmy klasyfikacji tekstów i ich wykorzystanie w systemie wykrywania plagiatów, Oficyna Wydawnicza Politechniki Warszawskiej, ISBN 978-83-7814-189-1, 2014.
* [6] Marek Szczepański, Testy skuteczności algorytmu preselekcji Otwartego Systemu Antyplagiatowego, in Brunon Hołyst, Jacek Pomykała, Piotr Potejko (eds.) Nowe techniki badań kryminalistycznych a bezpieczeństwo informacji, pp. 248 – 256, PWN, ISBN/ISSN: 978-83-01-17890-1 , 2014
* [7] Marek Kowalski, Piotr Kruszyński, Ścibór Sobieski, Maciej Sysak, Geneza, architektura i testy otwartego systemu antyplagiatowego,w tomie pod redakcją Brunon Hołyst, Jacek Pomykała, Piotra Potejko (eds.) Nowe techniki badań kryminalistycznych a bezpieczeństwo informacji, pp. 257 – 273, PWN, ISBN/ISSN: 978-83-01-17890-1 , 2014
* [8] Marek Kowalski, Marek Szczepański, Identity of academic theses, in
{{przypisy}}
[[Kategoria:Prawo autorskie]]
[[Kategoria:Algorytmy tekstowe]]
|