Допомога при роботі з антиплагіат програмою для перевірки тексту на унікальність

Попросту дублюються найбільш часті команди з меню.

Як джерела перевіряється тексту можна використовувати:

Сторінка являє собою вікно вбудованого браузера.

У журнал логіруются результати перевірки в режимі реального часу, крім цього сюди записуються різні діагностичні повідомлення, а також повідомлення про помилки.

За замовчуванням детальний логінг в журнал відключений, але при бажанні його можна включити в налаштуваннях програми (Операції / Налаштування / Звіт / Висновок в журнал докладної інформації про хід виконання перевірки).

налаштування програми

Принцип роботи перевірки унікальності тексту:

Основні параметри - група параметрів задає ключові настройки у визначенні унікальності тексту (що вони означають описано в самому початку).

Метод виявлення копій. Метод виявлення рерайта - задають алгоритм порівняння вихідного тексту з кожної з закачаних сторінок в процесі перевірки.

Число слів в шинглів - задає розмір шингли в методі виявлення копій (метод шинглів).

'Встановити загальні налаштування' - містить ряд попередньо встановлених наборів параметрів з Основні параметри. За замовчуванням. Експрес. Глибокі. Збережені містить останні збережені користувачем набір параметрів з Основні параметри.

Операція Перевірити унікальність як налаштувань з Основні параметри використовує набір параметрів з Збережені.

Ігнорувати цитати - ігнорувати чи цитати в вихідному перевіряється тексті. Цитатою вважається текст, обрамлений або подвійними лапками ( ""), або лапками-ялинками ( «»). (Використовується тільки в методі виявлення копій).

Перевірка на дублі в початковому тексті - при виборі даної опції на початку перевірки вихідний текст розбивається на невеликі блоки, які порівнюються один з одним (що дозволяє, наприклад, знайти скопійовані абзаци в перевіряється документі).

Визначення унікальності / Поріг унікальності (%) - задає максимально допустимий відсоток збігу вихідного перевіряється тексту з кожної з закачаних сторінок в процесі перевірки. У разі якщо цей поріг перевищено - операція перевірки автоматично завершується. За замовчуванням дорівнює 50%.

У разі відсутності прямого доступу до Інтернет ця вкладка дозволяє задати проксі.

Примітка. слід врахувати, що в цьому випадку буде неможливо використовувати список проксі як засіб захисту від автопоиска (Настройки / Інші / Захист від автопоиска / Використовувати список проксі)

Автозбереження - задає кількість останніх звітів, які будуть автоматично додаватися до папки Документи / Inet-trade / Autosave в домашній папці користувача після кожної операції перевірки. Іменуватися звіти будуть відповідно до часу закінчення відповідної перевірки. Швидкий доступ до них з програми можливий через меню Файл / автозбереження.

Історія - задає кількість останніх операцій пошуку, які будуть зберігатися. Це впливає на доступність результатів тієї чи іншої операції перевірки з Журналу.

Журнал - дозволяє в журналі включити докладний логування подій в процесі перевірки тексту на унікальність. За замовчуванням вимкнено.

Пакетна перевірка - дозволяє вказати директорію, куди зберігати звіти для кожного перевіряється документа / веб-сторінки в процесі пакетної перевірки / перевірки сайту.

Примітка. це має сенс для великих пакетів, коли звіт в журналі може вийти настільки великим, що буде викликати гальмування або навіть зависання програми.

Використовувати альтернативну схему скачки - дозволяє використовувати інший внутрішній механізм закачування сторінок в процесі перевірки.

Примітка. використовуйте цю схему, якщо є якісь проблеми при скачуванні сторінок під час роботи програми (наприклад, в разі виникнення великої кількості помилок "Неможливо завантажити сторінку."). Ця ж схема використовується і при формуванні списку сторінок сайту з 'Перевірка сайту'.

Задіяти економну витрату пам'яті - включає режим економного використання оперативної пам'яті.

Примітка. використовуйте економну витрату пам'яті при появі помилок про її нестачі (як правило при перевірці великих текстів). Але в цьому випадку буде неможливо подивитися на підсвічування запропонованих варіантів на web-документах, з якими порівнювався вихідний текст.

Приклад змісту такого файлу:

Ігнорувати при перевірці домени з файлу - дозволяє задати цілі домени, які будуть ігноруватися при перевірці. Звичайний текстовий файл (.txt) повинен містити набір доменів, кожен на окремому рядку.

Приклад змісту такого файлу:

Оновлення - дозволяє перевіряти наявність нової версії програми при кожному її запуску. У разі наявності нової версії буде видано запрошення оновити програму. При оновленні налаштування користувача не втрачаються, а беруться з попередньої (тобто поточної) версії.

  • Мінімальний інтервал між суміжними запитами до пошукової системи - задає час в секундах, не дає здійснювати запити до однієї і тієї ж пошуковій системі за дуже короткий період часу.
  • Максимальне число спроб здійснення запитів до пошукових систем - дає можливість повторити один і той же запит до пошукової системи в разі попередніх невдалих спроб, що позитивно позначається на якості перевірки.
  • Таймаут закачування кожної сторінки - задає максимальний час в секундах, яке відводиться на закачування кожного web-документа. Якщо за цей проміжок часу не вдалося закачати сторінку, то вона відкидається (в режимі докладного логування в Журнал пишуться повідомлення про перевищення часу очікування в цьому випадку).

Примітка. У разі поганого інтернет-з'єднання значення цього параметра можливо доведеться збільшити.

  • Максимальна кількість одночасно завантажуваних сторінок

    Примітка. У разі поганого інтернет-з'єднання значення цього параметра можливо доведеться зменшити.

    Захист від автопоиска

    Має сенс, тільки якщо не використовується сервіс антікапчі. Якщо це так, то коли пошукова система вимагає капчу, операція перевірки тексту на унікальність призупиняється, і програма дає можливість користувачеві ввести требуюмую капчу. Якщо "Показувати капчу" відключено, то програма не просити вводити її і намагатися заново побудувати той же самий запит до тієї ж пошуковій системі (в цьому випадку якість перевірки може значно погіршитися, замість цього краще вимкніть непотрібні пошукові системи).

  • Використовувати сервіс антікапчі

    Має сенс, тільки якщо не використовується список проксі. Якщо це так, то коли пошукова система вимагає капчу, операція перевірки тексту на унікальність призупиняється, і програма відсилає цю капчу сервісу розпізнавання капч. По завершенні розпізнавання програма продовжить роботу.

    Примітка. в режимі докладного логування в Журнал буде записуватися як сама капча (картинкою), так і результат її розпізнавання.

    Дозволяє задати список проксі, через які будуть будуватися запити до пошукових систем. Параметр Максимальне число спроб здійснення запитів до пошукових систем дозволяє задати максимальну кількість одного і того ж запиту до однієї і тієї ж пошуковій системі через різні проксі. Наприклад, при першій спробі запит до пошукової системи не вдався через перевищення часу очікування або захисту від автопоиска, тоді робиться друга спроба того ж запиту через інший проксі, якщо не вийшло - то через третій і.т.д.

    Примітка. в Журналі число спроб завантаження сторінок вказується в квадратних дужках.

    Підтримувані типи проксі: http, socks4 (a), socks5.

    Формат рядка в файлі:

    Приклад змісту такого файлу:

    certowa.lawson.com:80
    60.175.203.243:8080@login:parol
    shack.bottalk.org:3128
    opwv-demo-04.openwave.com:8088
    061244235034.static.ctinets.com:3128

    Пакетна перевірка / Перевірка сайту / Локальна перевірка

    Перевірка документів з вказаній директорії - рекурсивно беруться всі текстові, вордовскіе і pdf-файли (* .txt, * .doc, * .docx, * .pdf, * .odt), але не більше ніж зазначено в 'Максимальна кількість документів'. За замовчуванням кодування визначається автоматично, але можна вказати і вручну з рядом знаходиться спливаючого списку з кодуваннями. Опціонально можна вказати директорію, в яку потрібно переміщати перевірені документи в залежності від їх унікальності.

    Перевірка розбивається на кілька етапів:

    Примітка. перед закачуванням можна налаштувати фільтр Url, що дозволяє відсіяти небажані веб-документи.

  • У вікні з закачаними сторінками є стовпчик Вибір. який дозволяє зняти з перевірки будь-яку сторінку - це можна зробити на цьому етапі.
  • Запуск безпосередньо перевірки.
  • У локальної перевірки проводиться пошук збігів вихідного тексту з документами з вказаної папки (проіндексованої системою) і її підпапок (якщо відзначена галка Враховувати при пошуку піддиректорії). При пошуку не враховуватимуться документи, чий розмір перевищує пороговий - Макс. Розмір документів (Мб). Підтримувані типи документів - * .txt, * .doc, * .docx, * .pdf, * .odt.

    Примітка. У Windows XP за замовчуванням в якості пошукового движка використовується вже застаріла технологія WDS (Windows Desktop Search). А оскільки Локальна перевірка розрахована на технологію Windows Search, в цьому випадку може знадобитися встановити Windows Search 4.0.

    Примітка. Щодо файлів у форматі .txt є один нюанс - вони повинні бути закодовані належним чином. Наприклад, для російськомовної windows вони повинні бути в кодуванні windows-1251 або utf-16 (якщо будуть в utf8, то пошук windows може їх не знайти).

    AntiPlagiarism.NET -
    Перевірка тексту на унікальність

    • Здійснює пакетну перевірку всіх текстів із заданої директорії
    • Акуратно визначає унікальність тексту
    • Знаходить і підсвічує неунікальні фрагменти тексту прямо на відновленої копії веб-сторінки

    Безкоштовна Демо-версія 31 день

    • Визначає унікальність веб-сторінок
    • Шукає збігу по збереженим копіям пошуковиків
    • Працює зі списком проксі і багато іншого

    Схожі статті