модель модулю не детермінована за умовою використання налаштувань параметрів temperature та top_p за замовченням, або вище, тому результат для генерованого контенту майже завжди унікальний. ви можете поєкспериментувати та дослідити це в демо, порінявши послідовно згенеровані декілька варіантів.
ступінь унікалізації збільшується єкспоненційно зі збільшенням об'єму контенту та зі зміною параметрів temperature, presence_penalty, та frequency_penalty.
теоретично, звісно, может бути таке, що "мавпа надрукує Гамлета", але в реальних умовах використання шанс катастрофічно низький, та й все одно не перевищить вірогідність такого ж самого сценарію при написанні рерайту контент-менеджером.
-------------
перевіряти між корстувачами все одно не є практично можливим, т.як. це потрібно розроблювати інструмент тотального контролю та перевірки типу "Всі-між-всіма", всі документи користувачів перевірювати не тільки між іншими користувачами, але ще й між собою + перевіряти методом шинглів чи іншим наявність у пошукових системах, це надмірно глобально, ресурсозатратно та порушить безпеку персональних даних. та й дійсно немає сенсу, тому що модель GPT як раз й основана не на чіткому алгорітмі, а генеренації на основі ймовірнісних збігів - тобто, вона по природі своїй налаштована генерувати унікальність.