Звуковые данные и функции преобразования Фурье, БПФ и спектрограмм для системы распознавания речи
Половинченко М.И., Елисеев В.С.
Ключевые слова: преобразование Фурье, аудиоданные, распознавание речи, спектрограмма.
Аннотация. Почти в каждой организации ежедневно генерируется огромное количество аудиоданных. Аудиоданные дают существенную стратегическую информацию, когда они доступны для специалистов по обработке данных для заправки двигателей искусственного интеллекта и аналитики. В этой статье показано, как работать с аудиоданными и несколькими методами анализа звука с нуля. Кроме того, это дает отправную точку для построения систем распознавания речи.
Audio data and Fourier transform, FFT, and spectrogram functions for speech recognition
Polovinchenko M.I., Eliseev V.S.
Keywords: Fourier transform, audio data, speech recognition, spectrogram.
Abstract. Almost every organization generates a huge amount of audio data every day. Audio data provides essential strategic information when it is available to data scientists to fuel the engines of artificial intelligence and analytics. This article shows you how to work with audio data and several audio analysis methods from scratch. In addition, it provides a starting point for building speech recognition systems.