Пиперски А.Ч
В данной статье анализируется использование понятия репрезентативности в корпусной лингвистике и делается вывод о том, что в отсутствие точных методов оценки репрезентативность корпуса определяется негласной договоренностью между создателями корпуса и его пользователями. Разрабатываемый в настоящее время Генеральный интернет-корпус русского языка (ГИКРЯ) задумывается как инструмент, позволяющий эксплицировать подобные договоренности и изучать русский язык в его дифференциальной полноте. Исследователи получат ресурс, позволяющий анализировать отдельные сегменты Интернета и создавать подкорпуса на основе метаразметки, извлекаемой автоматически. В настоящее время в ГИКРЯ размечены и доступны для поиска два сегмента русского Интернета: блог-платформа LiveJournal.com и «Журнальный зал». В дальнейшем количество сегментов планируется существенно расширить.
Библиографическая ссылка
Пиперски А.Ч ГЕНЕРАЛЬНЫЙ ИНТЕРНЕТ-КОРПУС РУССКОГО ЯЗЫКА И ПОНЯТИЕ РЕПРЕЗЕНТАТИВНОСТИ В КОРПУСНОЙ ЛИНГВИСТИКЕ // Научное обозрение. Физико-математические науки . 2020. № 1. С. 47-48;URL: https://physics-mathematics.ru/ru/article/view?id=63 (дата обращения: 24.06.2026).
science-review.ru