Для інформації.
Буде корисною.
Вплив FWR та TTR на оцінку якості контенту
Привіт, друзі, прочитав цікаве дослідження (https://downloads.webis.de/publications/papers/bevendorff_2024a.pdf). Дослідники аналізують різні ознаки спаму і кореляції між ними. У тексті дослідження згадуються кілька метрик, які видалися мені цікавими.
Співвідношення службових слів (FWR) — це метрика, яка використовується для оцінки частки службових слів (наприклад, прийменників, сполучників) і змістовних слів (наприклад, іменників, дієслів) у тексті. Цей коефіцієнт може бути індикатором якості та корисності контенту, зокрема в контексті читабельності та розуміння.
Інше визначення FWR:
FWR (Function Word Ratio) - це показник, який вимірює співвідношення службових слів до загальної кількості слів у тексті.
Високий показник FWR може свідчити про те, що текст містить багато повторюваних фраз, має просту структуру та недостатньо різноманітну лексику. Це може бути ознакою низької якості контенту, створеного з метою маніпулювання пошуковими системами, а не для інформування користувачів.
Ще одна цікава метрика: TTR
Співвідношення типів слів до загальної кількості слів (TTR) розраховується за простою формулою:
TTR = Кількість унікальних слів / Загальна кількість слів
Низьке значення TTR свідчить про обмежене розмаїття лексики та часте повторення одних і тих же слів.
Співвідношення типів слів (TTR): Хоча спостерігається деяка кореляція між TTR та рейтингом, цей зв'язок слабший, ніж у випадку з FWR, та зникає для сторінок з найвищими рейтингами.
Низький TTR може бути ознакою низькоякісного контенту, написаного поспіхом або автоматично згенерованого.
Приклад аналізу тексту за допомогою ChatGPT:
Висновок щодо якості контенту: Як FWR, так і TTR свідчать про високу якість контенту. FWR не є непропорційно високим, а це означає, що текст зберігає хороший баланс між граматичною структурою та інформативністю. Високий TTR демонструє, що контент має значне лексичне розмаїття, що свідчить про ретельну та цілеспрямовану підготовку для надання детальної інформації без надмірного використання простої лексики. Таким чином, контент не виглядає низькоякісним, поспіхом написаним або автоматизованим. Навпаки, він створений для аудиторії, яка потребує глибоких знань алгоритмів SEO та пов'язаних з ними стратегій, що гарантує, що текст є одночасно освітнім і контекстуально релевантним.
SEO Inside