<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2020.30.3.016</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">831</article-id>
      <title-group>
        <article-title xml:lang="ru">Модели и методы анализа тональности в текстах на башкирском языке</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>Models and methods for sentiment analysis of texts in Bashkir language</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Сулейманов</surname>
              <given-names>Азамат Каримович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Suleimanov</surname>
              <given-names>Azamat K.</given-names>
            </name>
          </name-alternatives>
          <email>azamat-sul2010@yandex.ru</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Шарипова</surname>
              <given-names>Миляуша Амировна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Sharipova</surname>
              <given-names>Milyausha A.</given-names>
            </name>
          </name-alternatives>
          <email>mamirovna@yandex.ru</email>
          <xref ref-type="aff">aff-2</xref>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Сметанина</surname>
              <given-names>Ольга Николаевна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Smetanina</surname>
              <given-names>Olga N.</given-names>
            </name>
          </name-alternatives>
          <email>smoljushka@mail.ru</email>
          <xref ref-type="aff">aff-3</xref>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Сазонова</surname>
              <given-names>Екатерина Юрьевна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Sazonova</surname>
              <given-names>Ekaterina Y.</given-names>
            </name>
          </name-alternatives>
          <email>rassadnikova_ekaterina@mail.ru</email>
          <xref ref-type="aff">aff-4</xref>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Миронов</surname>
              <given-names>Константин Валерьевич</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Mironov</surname>
              <given-names>Konstantin V.</given-names>
            </name>
          </name-alternatives>
          <email>mironovconst@gmail.com</email>
          <xref ref-type="aff">aff-5</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Уфимский государственный авиационный технический университет</aff>
        <aff xml:lang="en">Ufa State Aviation University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-2">
        <aff xml:lang="ru">Уфимский государственный авиационный технический университет</aff>
        <aff xml:lang="en">Ufa State Aviation University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-3">
        <aff xml:lang="ru">Уфимский государственный авиационный технический университет</aff>
        <aff xml:lang="en">Ufa State Aviation Technical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-4">
        <aff xml:lang="ru">Уфимский государственный авиационный технический университет</aff>
        <aff xml:lang="en">Ufa State Aviation Technical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-5">
        <aff xml:lang="ru">Уфимский государственный авиационный технический университет</aff>
        <aff xml:lang="en">Ufa State Aviation Technical University</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2020.30.3.016</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=831"/>
      <abstract xml:lang="ru">
        <p>Исследования в области автоматического извлечения мнений по-прежнему остаются&#13;
актуальными. В статье представлено формальное описание термина мнение, постановки задач&#13;
в зависимости от определяемых свойств мнения. Описаны проблемы решения задачи анализа&#13;
тональности текста, подходы к ее решению и готовые программные реализации. Приведены&#13;
имеющиеся корпусы текстов на башкирском языке, а также постановка задачи анализа&#13;
тональности в текстах на башкирском языке. Рассмотрена методика ее решения, включающая&#13;
алгоритм разметки текста, методы предобработки, выбора признаков классификации, методы&#13;
классификации, приведены результаты эксперимента с целью выбора наиболее эффективного&#13;
метода классификации для программной реализации с учетом метрик качеств. Полученные в&#13;
работе результаты и разработанное программное решение на основе SVM со стохастическим&#13;
градиентным спуском, продемонстрировавшим наиболее высокие показатели в критериях&#13;
точности, полноты и F-меры, могут быть использованы для оценки тональности текстов&#13;
новостных сайтов на башкирском языке.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>The research works on automatic opinion extraction are still relevant. The article presents a&#13;
formal description of the term opinion, setting tasks depending on the determined properties of&#13;
opinion. The problems of solving the tasks of sentiment analysis, approaches to its solution and readymade software implementations are described. Available corpora of texts in the Bashkir language are&#13;
presented, and also task statement for sentiment analysis in the Bashkir language. Presented solution,&#13;
which include an algorithm for tagging the texts, a preprocessing algorithm, a choice of classification&#13;
features, and classification algorithms. Also, the results of computational experiment, which aimed to&#13;
define the most effective classifier based on quality metric, are present. The results in this work and&#13;
the developed software solution based on SVM with stochastic gradient descent, which demonstrated&#13;
the highest indicators in the criteria of accuracy, completeness, and F-measure, can be used to sentiment analysis of news sites in the Bashkir language. The results of the research presented in this&#13;
article were supported by Grants RFBR 19-07-00709, 20-08-00668 and Ministry of Science and&#13;
Higher Education of the Russian Federation in the framework of the work under the State Assignment&#13;
of Ufa State Aviation Technical University # FEUE-2020-0007.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>анализ тональности текста</kwd>
        <kwd>компьютерная лингвистика</kwd>
        <kwd>машинное обучение</kwd>
        <kwd>признаки классификации</kwd>
        <kwd>гибридный подход</kwd>
        <kwd>метод опорных векторов</kwd>
        <kwd>случайный лес</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>sentiment analysis</kwd>
        <kwd>computational linguistics</kwd>
        <kwd>machine learning</kwd>
        <kwd>classification features</kwd>
        <kwd>hybrid intelligent system</kwd>
        <kwd>support vector machine</kwd>
        <kwd>random forest</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено без спонсорской поддержки.</funding-statement>
        <funding-statement xml:lang="en">The study was performed without external funding.</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Ананьева М. И., Кобозева М. В., Соловьев Ф. Н., Поляков И. В., Чеповский А. М.&#13;
О проблеме выявления экстремистской направленности в текстах. Вестник&#13;
Новосибирского государственного университета. Серия: Информационные&#13;
технологии. 2016;14(4):5–13.</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Башкирский поэтический корпус. Доступно по адресу: http://webcorpora.net/bashcorpus/search/?interface_language=ru (дата обращения 30.04.2020).</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Бодрунова С.С. Кросс-культурный тональный анализ пользовательских текстов в&#13;
Твиттере. Вестник Московского университета Серия 10. Журналистика.&#13;
2018;6:191-212.</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">Воронина И. Е., Гончаров В. А. Анализ эмоциональной окраски сообщений в&#13;
социальных сетях (на примере сети «вконтакте»). Вестник ВГУ. Серия :Системный&#13;
анализ и информационные технологии. 2015;4:151-158.</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Горбушин Д. А., Гринченков Д. В., Мохов В. А., Нгуен Фук Хау Системный&#13;
анализ подходов к решению задачи идентификации тональности текста. Известия&#13;
вузов. Северо-кавказский регион. Технические науки. 2016;2:36-41.</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Гаршина В. В., Калабухов К. С., Степанцов В. А., Смотров С. В. Разработка&#13;
системы анализа тональности текстовой информации. Вестник ВГУ, Серия:&#13;
Системный анализ и информационные технологии. 2017;3:185-194.</mixed-citation>
      </ref>
      <ref id="cit7">
        <label>7</label>
        <mixed-citation xml:lang="ru">Ермаков А. Е., Киселев С. Л. Лингвистическая модель для компьютерного&#13;
анализа тональности публикаций СМИ. Компьютерная лингвистика и&#13;
интеллектуальные технологии:труды Международной конференции Диалог’2005.&#13;
Москва:Наука, 2005. Доступно по адресу: http://www.dialog21.ru/media/2365/ermakov-kiselev.pdf (дата обращения 30.04.2020).</mixed-citation>
      </ref>
      <ref id="cit8">
        <label>8</label>
        <mixed-citation xml:lang="ru">Клековкина М. В., Котельников Е. В. Метод автоматической классификации&#13;
текстов по тональности, основанный на словаре эмоциональной лексики.&#13;
Электронные библиотеки:перспективные методы и технологии, электронные&#13;
коллекции (RCDL-2012):труды 14-й Всероссийской научной конференции&#13;
(Переславль-Залесский, Россия, 15-18 октября 2012 г.). 2012:81-86. Доступно по&#13;
адресу: http://ceur-ws.org/Vol-934/paper15.pdf (дата обращения 30.04.2020).</mixed-citation>
      </ref>
      <ref id="cit9">
        <label>9</label>
        <mixed-citation xml:lang="ru">Колмогорова А. В., Калинин А. А., Маликова А. В. Лингвистические принципы и&#13;
методы компьютерной лингвистики для решения задач сентимент-анализа&#13;
русскоязычных текстов. Актуальные проблемы филологии и педагогической&#13;
лингвистики. 2018;1(29):139-148.</mixed-citation>
      </ref>
      <ref id="cit10">
        <label>10</label>
        <mixed-citation xml:lang="ru">Котельников, Е.В. Комбинированный метод автоматического определения&#13;
тональности текста. Программные продукты и системы. 2012;3:189-195.</mixed-citation>
      </ref>
      <ref id="cit11">
        <label>11</label>
        <mixed-citation xml:lang="ru">Краснов Ф. В. Анализ тональности текста научно-практических статей по&#13;
нефтегазовой тематике с помощью искусственных нейронных сетей. Вестник&#13;
Евразийской науки. 2018;3(10). Доступно по адресу:&#13;
https://esj.today/PDF/43ITVN318.pdf (дата обращения 30.04.2020).</mixed-citation>
      </ref>
      <ref id="cit12">
        <label>12</label>
        <mixed-citation xml:lang="ru">Лукашевич Н. В. Автоматический анализ тональности текстов по отношению к&#13;
заданному объекту и его характеристикам. Russian Digital Libraries Journal.&#13;
2015;18b(3-4):88-119.</mixed-citation>
      </ref>
      <ref id="cit13">
        <label>13</label>
        <mixed-citation xml:lang="ru">Лукашевич Н. В., Четверкин И. И. Комбинирование тезаурусных и корпусных&#13;
знаний для извлечения оценочных слов. Системы и средства информатики.&#13;
2015;25(1):20–33.</mixed-citation>
      </ref>
      <ref id="cit14">
        <label>14</label>
        <mixed-citation xml:lang="ru">Меньшиков И. Л., Кудрявцев А. Г. Обзор систем анализа тональности текста на&#13;
русском языке. Молодой ученый. 2012;12(47):140-143. Доступно по адресу:&#13;
https://moluch.ru/archive/47/5951/ (дата обращения 30.04.2020).</mixed-citation>
      </ref>
      <ref id="cit15">
        <label>15</label>
        <mixed-citation xml:lang="ru">Минина М. А. Психолингвистический анализ семантики оценки (на материале&#13;
глаголов движения):автореферат дис. ... кандидата филологических наук:10.02.19.&#13;
Москва, 1995:22.</mixed-citation>
      </ref>
      <ref id="cit16">
        <label>16</label>
        <mixed-citation xml:lang="ru">Официальный сайт компании Ай-Теко. Доступно по адресу: https://www.iteco.ru/solutions/business_intelligence_products/analiz_tonalnosti_teksta/(дата&#13;
обращения 30.04.2020).</mixed-citation>
      </ref>
      <ref id="cit17">
        <label>17</label>
        <mixed-citation xml:lang="ru">Пазельская А. Г., Соловьев А. Н. Метод анализа эмоций в текстах на русском&#13;
языке. Компьютерная лингвистика и интеллектуальные технологии:материалы&#13;
ежегодной Международной конференции «Диалог» (Бекасово, 25–29 мая 2011 г.).&#13;
М.: Изд-во РГГУ. 2011;10 (17):510-552. </mixed-citation>
      </ref>
      <ref id="cit18">
        <label>18</label>
        <mixed-citation xml:lang="ru">Посевкин Р.В. Автоматизация сентимент-анализа текста. Междисциплинарный&#13;
диалог: современные тенденции в гуманитарных, естественных и технических&#13;
науках:сборник трудов IV Всероссийской научно-практической конференции&#13;
преподавателей, ученых, специалистов и аспирантов. Издательство: Общество с&#13;
ограниченной ответственностью "Полиграф-мастер" (Челябинск). 2015:242-244.</mixed-citation>
      </ref>
      <ref id="cit19">
        <label>19</label>
        <mixed-citation xml:lang="ru">Романов А. С., Васильева М. И., Куртукова А.В., Мещеряков Р. В. Анализ&#13;
тональности текста с использованием методов машинного обучения. Доступно по&#13;
адресу:http://ceur-ws.org/Vol-2233/Paper_8.pdf (дата обращения 30.04.2020).</mixed-citation>
      </ref>
      <ref id="cit20">
        <label>20</label>
        <mixed-citation xml:lang="ru">Сарбасова А.Н. Исследование методов сентимент-анализа русскоязычных&#13;
текстов// Молодой ученый. 2015;8(88):143-146. Доступно по адресу:&#13;
https://moluch.ru/archive/88/17413/. (дата обращения 30.04.2020)</mixed-citation>
      </ref>
      <ref id="cit21">
        <label>21</label>
        <mixed-citation xml:lang="ru">Сиразитдинов З. А., Полянин А.И., Ибрагимова А. Д., Ишмухаметова А.Ш.&#13;
Корпусы башкирского языка: принципы разработки. Проблемы востоковедения.&#13;
2013;4 (62):65-72.</mixed-citation>
      </ref>
      <ref id="cit22">
        <label>22</label>
        <mixed-citation xml:lang="ru">Толкунов А. А. Модель оперативной аналитической обработки текстовых&#13;
комментариев к законопроектам: автореферат дис. ... кандидата технических&#13;
наук: 05.13.17. Орел:Академия ФСО, 2014:24.&#13;
</mixed-citation>
      </ref>
      <ref id="cit23">
        <label>23</label>
        <mixed-citation xml:lang="ru">Тутубалина Е.В., Иванов В. В., Загулова М., Мингазов Н., Алимова И., Малых В.&#13;
Тестирование методов анализа тональности текста, основанных на словарях.&#13;
Электронные библиотеки. 2015;18(3-4):138-162.</mixed-citation>
      </ref>
      <ref id="cit24">
        <label>24</label>
        <mixed-citation xml:lang="ru">Усталов Д. В. Извлечение терминов из русскоязычных текстов при помощи&#13;
графовых моделей. Доступно по адресу:http://koost.eveel.ru/ science/&#13;
CSEDays2012.pdf. (дата обращения 30.04.2020).</mixed-citation>
      </ref>
      <ref id="cit25">
        <label>25</label>
        <mixed-citation xml:lang="ru">Устный корпус башкирского языка. Доступно по адресу:&#13;
https://linghub.ru/oral_bashkir_corpus/ (дата обращения 30.04.2020).</mixed-citation>
      </ref>
      <ref id="cit26">
        <label>26</label>
        <mixed-citation xml:lang="ru">Чиркин Е. С., Лопатин Д. В. Подходы к нечеткому поиску нежелательного&#13;
контента на веб-странице. Вестник Тамбовского университета. Серия&#13;
Естественные и технические науки. Тамбов. 2016;21(6):2358-2365.</mixed-citation>
      </ref>
      <ref id="cit27">
        <label>27</label>
        <mixed-citation xml:lang="ru">Abbasi M. M., Beltiukov A. P. Анализ эмоций из текста на русском языке с&#13;
использованием синтаксических методов. Information Technology and Systems:7th International Science Conference. At Khanty-Mansiysk. Russian Federation. 2019.&#13;
Доступно по адресу: https://www.researchgate.net/publication/333489703Analiz_em&#13;
ocijiz_teksta_na_russkom_azyke_s_ispolzovaniem_sintaksiceskih_metodov (дата&#13;
обращения 30.04.2020).</mixed-citation>
      </ref>
      <ref id="cit28">
        <label>28</label>
        <mixed-citation xml:lang="ru">Yan G. et al. A bilingual approach for conducting Chinese and English social media&#13;
sentiment analysis. Computer Networks. 2014;75(PB):491-503.</mixed-citation>
      </ref>
      <ref id="cit29">
        <label>29</label>
        <mixed-citation xml:lang="ru">Kadam S.A., Joglekar S.T. Sentiment Analysis:An Overview. International Journal of&#13;
Research in Engineering &amp; Advanced Technology. 2013;1(4).</mixed-citation>
      </ref>
      <ref id="cit30">
        <label>30</label>
        <mixed-citation xml:lang="ru">Kennedy A., Inkpen D. Sentiment classification of movie reviews using contextual&#13;
valence shifters. Computational Intelligence. 2006;22:110-125. </mixed-citation>
      </ref>
      <ref id="cit31">
        <label>31</label>
        <mixed-citation xml:lang="ru">Liu B. Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human&#13;
Language Technologies #16. 2012;XIV:165.&#13;
</mixed-citation>
      </ref>
      <ref id="cit32">
        <label>32</label>
        <mixed-citation xml:lang="ru">Moilanen K., Pulman S., Zhang Y. Packed Feelings and Ordered Sentiments:Sentiment&#13;
Parsing with Quasi-compositional Polarity Sequencing and Compression. Computational&#13;
Approaches to Subjectivity and Sentiment Analysis (WASSA 2010):proceedings of the 1st&#13;
Workshop at the 19th European Conference on Artificial Intelligence (ECAI&#13;
2010).2010:36-43. </mixed-citation>
      </ref>
      <ref id="cit33">
        <label>33</label>
        <mixed-citation xml:lang="ru">Opinion lexicon English Доступно по адресу: https://github.com/jeffreybreen/twittersentiment-analysis-tutorial-201107/tree/master/data/opinion-lexicon-English (дата&#13;
обращения 30.04.2020).</mixed-citation>
      </ref>
      <ref id="cit34">
        <label>34</label>
        <mixed-citation xml:lang="ru">Potapova R., Komalova L. Multimodal perception of aggressive behavior. Lecture&#13;
Notes in Computer Science. 2016;9811:499-506.</mixed-citation>
      </ref>
      <ref id="cit35">
        <label>35</label>
        <mixed-citation xml:lang="ru">Wiebe J.M., Wilson, T., Cardie, C. Annotating expressions of opinions and emotions in&#13;
language. Language Resources and Evaluation. 2005;39 (2-3):165-210.</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>