что такое потоковая речь
Потоковое мышление: секрет номер один твоей производительности
Что такое состояние потока
В этом состоянии протекает продуктивнее учёба, работа, бизнес, творчество — всё это работает на максимум. Даже в деревне в этом состоянии люди могут принять роды у трёх свиней за короткий промежуток вместо привычных двух. Состояние потока — это твой мозг на максималках. И чтобы в него войти, совсем необязательно кушать таблетку.
Как в него войти
Чтобы примерить это состояние на себя, нужно делать поистине трудную работу, другими словами: вызвать состояние потока, чтобы аккуратно грызть ногти, не получится, да и незачем. Мозгу должно быть некомфортно, нужно выбрать что-то по-настоящему сложное для себя: написать стих, отрывок книги, сосчитать сдачу в маршрутке без калькулятора. В общем, мозг должен быть в напряжении, которое характеризуется спутанными мыслями, ленью и иногда даже раздражением. Такое раздражение испытываешь, когда пытаешься решить сложную задачу или когда в твоём любимом кафе нет блюд в наличии, которые ты хотел бы заказать. Мозг в этом состоянии работает в режиме бета-волн, надпочечники выбрасывают в кровь адреналин и кортизол, полезный гормон. После этого нужно расслабиться, но не сильно — спать ложиться не следует. Во время расслабления наш мозг раскладывает всё по полочкам, всю информацию, которая у него есть (если она есть). Как это сделать — неважно. Посмотреть в окно, обнять березку, полежать на лавочке — главное, что нужно знать: мозгу нужен воздух.
Несколько пунктов, которые будут полезны, если ты захотел сделать пятилетку за три года
1. Полная концентрация
Поток требует полного поглощения в поставленную задачу, поэтому один из самых простых способов максимизировать поток — минимизировать отвлечение. Выключи телефон, не проверяй электронную почту и повесь табличку «Не беспокоить» на дверь. Исследования показывают, что блоки непрерывной концентрации от 90 до 120 минут работают лучше всего. Расставь приоритеты в потоке, выделив первые 90 минут дня для того, чтобы заблокировать мир и выдвинуть вперёд наиболее важные задачи.
2. Опасные последствия
Поток следует за слабаками, и боязнь жутких последствий усиливает внимание. Это одна из главных причин, по которой спортсмены, занимающиеся активными и экстремальными видами спорта, так хорошо генерируют поток — они работают в условиях невероятно высокого риска. Но тем, кто не заинтересован в физическом риске, можно пойти на интеллектуальный, творческий или социальный риск. Наиболее важным моментом является научиться последовательно ориентироваться на вызовы, принимать риски и использовать их для привлечения своего внимания.
3. Нужен контроль со стороны
Мгновенная обратная связь означает, что мы знаем, где мы находимся и куда идем. Таким образом, нам не нужно отвлекать наше внимание от настоящего, чтобы исправить ситуацию. Если ты занимаешься магией, это означает, что нужно всегда практиковать трюки перед зеркалом. Если ты писатель, то у тебя должны быть невероятно близкие отношения с редактором. Но в любом случае — затяни петли. Забудь про годовые или ежеквартальные отчеты о прогрессе. Не получается так сделать на работе? Найди собеседника, который поможет тебе управлять твоими результатами.
4. Баланс навыков и вызовов
Часто называемый «золотым правилом потока» баланс между вызовами и навыками является наиболее важным элементом потока. Идея заключается в том, чтобы уделять особое внимание поставленной задаче, когда задача немного превышает твой набор навыков. Но только немного. Цель — растянуть, но не сломать. Это может быть сложно. Так как это сладкое пятно находится немного за пределами нашей зоны комфорта, регулярное его снятие требует умения чувствовать себя некомфортно.
5. Здоровый сон
Хочешь похудеть — нужен здоровый сон; нужно набрать массу — много спи; прокачать мозг — опять нужен сон. Бесконечные статьи на разные темы — такое ощущение, что сон им приплачивает, чтобы его рекламировали, но, на самом деле, сон и здесь нужен. Ведь настоящее обучение происходит во время сна, поэтому в те дни, когда ты трудишься в состоянии потока, важно соблюдать режим и не засиживаться до ночи, даже если только что вышла очередная серия любимого сериала.
Как превратить голос в текст: тестируем 5 сервисов для расшифровки
Я работаю с текстом и мечтаю о программе, которая сможет превратить голос в напечатанные слова.
Например, расшифрует за меня интервью длиной в несколько часов. Или позволит наговорить идеи, а в ответ пришлет заметку. Наконец, «напишет» за меня смс: поймет несколько обрывистых фраз и отправит адресату текст — потому что голосовые сообщения любят не все.
Я протестировал 5 таких сервисов: наговорил один и тот же текст, а потом сравнил результаты. Я использовал два способа: сначала давал программе послушать и расшифровать живой голос, а потом — в записи.
Текст для теста
Вот текст для теста: «Привет. Это тестовая запись для статьи об инструментах, которые умеют превращать голос в текст. Как думаете, этот сервис справится? Распознает интонацию вопроса и, например, числа — один, два, три? Вот что получилось».
Google Keep
Где работает: Android, iOS
Сколько стоит: бесплатно
Что умеет. Это приложение для создания и хранения заметок можно использовать как расшифровщик. Если на главном экране нажать на иконку микрофона и начать говорить, то сервис будет переводить звук в текст — это называется транскрибацией. Загрузить и расшифровать аудиофайл не получится.
У сервиса есть еще один минус: запись останавливается, если молчать две-три секунды, поэтому расшифровывать длинные интервью не получится. Разве что делать это небольшими кусками. Наговорить несколько идей и получить их в блокноте получится отлично.
Результат. Я проверил два способа: наговорил текст самостоятельно и включил запись того же текста через колонку — никакой разницы нет. Вышло хорошо: сервис не распознал только знаки препинания и напечатал числа без пробелов.
Сообщения «Вконтакте»
Где работает: Android, iOS
Сколько стоит: бесплатно
Что умеет. В мобильном приложении соцсеть умеет расшифровывать входящие голосовые сообщения. Это можно использовать и в наших целях: отправлять сообщения самому себе.
Для этого зайдите в раздел с диалогами и в поисковом окне вбейте свое имя. Дальше зажмите значок микрофона и наговорите сообщение. Когда оно появится в диалоговом окне, нажмите на «Аа» справа от записи.
Результат. «Вконтакте» расшифровал живой голос с ошибками в склонениях и перепутал несколько слов: например, «сервис» услышал как «серый». Но справился с числами. Записанный и пропущенный через колонку голос сервис расшифровал намного хуже — получился набор слов, который нужно буквально переписывать.
8 способов улучшить разговорную речь
Сегодня мы расскажем тебе о нескольких способах улучшить свою разговорную речь, проверенных временем. Указанные ниже советы сформулированы на основе выдержек из книги «Наш департамент» Джона Х. Янга, опубликованной в 1882 году. Как ты узнаешь дальше, актуальность этих советов не исчезла за почти 150 лет истории, как и понимание того, что без грамотной речи — никуда.
1. Тренировка памяти
Хорошая память — это неоценимая помощь в овладении искусством разговора, а потому заниматься ее развитием крайне важно на протяжении всей жизни. Помня обстоятельства ранней встречи с собеседником или апеллируя к каким-либо знаниям, ты бесспорно повысишь свой социальный авторитет. Заучивай короткие строки перед сном или делай соответствующие умственные упражнения, чтобы улучшить свою память. И постарайся уменьшить привычку делать заметки по любому поводу. Лучше полагаться на свою память, чем на записи в блокноте.
2. Запоминание имён по Генри Клею
Большим плюсом хорошей памяти является способность запоминать имена новых знакомых. Генри Клей — известный американский юрист 19 века, который заслужил свою лестную репутацию во многом потому, что обращался по имени к собеседникам уже на второй встрече. Запоминая имена людей и обстоятельства знакомства, Клей добивался положительного расположения к себе, что в его профессии является крайне ценным. Не сомневайся — в твоей тоже.
3. Письмо как тренажер
Так вышло, что когда мы выражаем мысли в письменной форме, то невольно стараемся грамотно их формулировать, уделяя внимание подбору слов, конструкции предложений и даже знакам препинания. Это делает наш язык более гибким, что в результате отражается и на разговорной речи. Поэтому привычка записывать свои мысли на бумагу так же хороша, как и соблюдение грамматических правил при отправке сообщений своим знакомым.
4. Чтение книг
Чтение книг — самый комплексный тренажер для развития собственной речи. Являясь самым главным носителем информации, книги увеличивают эрудицию, развивают память, стимулируют мыслительные процессы, расширяют словарный запас — в общем, обеспечивают человека всем необходимым, чтобы его разговорная речь обладала самым высоким уровнем как в эстетическом плане, так и в содержательном.
5. Прочь вульгаризмы
Свой разговор нужно скрупулезно защищать от всякого рода фамильярности, грубости и неоправданной эмоциональности. Простота и краткость языка являются характеристиками хорошо образованного и воспитанного человека. Использование чересчур патетичных фраз или неуместно сложной лексики зачастую говорит о попытке человека казаться умнее, чем он есть. На собеседника это вряд ли подействует и скорее скажет о твоей легкомысленности, чем о высоком интеллекте. И не стоит сильно увлекаться с жестикуляцией: она придает разговору непристойный стиль и может навредить репутации человека (особенно деловой) при знакомстве.
6. Умение слушать
Привычку слушать с интересом и вниманием, как и большинство положительных привычек, нужно в себе развивать. Даже если собеседник прозаичен как новостная сводка в 5 утра, воспитанный человек должен проявлять тактичность. Но только не надо лицемерить. Если ты не согласен с тем, что говорит твой оппонент, можешь высказать свою точку зрения в ответ. Грамотная и аргументированная речь в данном случае заставит собеседника прислушаться к твоим словам и вызвать у него положительную реакцию.
7. Быть оживленным
Твоя речь должна быть не только информативной и красивой лексически, но и живой. Никакой словарный запас не спасет, если доносить свои мысли с интонацией яндексовской «Алисы». Привнеси в свою речь немного эмоций, говори естественно и с расстановкой, улыбайся, шути (не злоупотребляя), будь активен и заинтересован — все это важно не меньше, чем выбранный тобою набор слов.
8. Что нельзя делать
Лесть, сплетни, насмешки, позерство, исправление ошибок — это те вещи, которые обречены на то, чтобы испортить впечатление о тебе до скончания веков. Хорошее мнение о себе не заработать неискренностью. Уверенность в себе, своих словах отражается и на способе их подачи. Речь неуверенного человека никогда не будет убедительной. А вот заискивание путем лести или распространение слухов могут повысить твой авторитет только в глазах кретина. Так же как и попытка себя расхваливать и демонстрировать словесную браваду.
Поймать полутона: как искусственный интеллект распознает эмоции в речи
Что ИИ может узнать по голосу
Несколько лет назад в США специалисты по искусственному интеллекту создали программу, которая способна по голосу выявлять посттравматическое стрессовое расстройство (ПТСР). Точность постановки диагноза превысила 89%, сообщал тогда журнал Depression and Anxiety.
В исследовании участвовали ветераны конфликтов в Ираке и Афганистане с диагнозом ПТСР и группа бывших военных, у которых не обнаружили такого расстройства. Программа изучала их речь, разбирая каждое слово и анализируя частоту, ритм, тон и артикуляционные характеристики. Исходя из этой информации она делала вывод о состоянии говорящего, в том числе о его эмоциях, самочувствии и психологическом здоровье.
Почему растет сектор речевой аналитики
На развитие рынка влияют несколько трендов.
Как ИИ и технологии машинного обучения работают в call-центре
«Пандемия разрушила барьеры на пути к инновациям, которые десятилетиями блокировали прогресс в индустрии контакт-центров», — отмечают отраслевые аналитики в отчете, опубликованном MarketsandMarkets. Теперь эти центры могут стать более эффективными и заботливыми с помощью речевого ИИ, который слушает звонки клиентов.
«Сервис для анализа эмоциональной окраски разговоров изучает звонки и сам находит записи, которые отличаются излишней эмоциональностью. Те участки, где клиент разговаривает с оператором на повышенных тонах, система помечает красным. Спорные участки окрашиваются в желтый. Их появление может быть связано с громким голосом клиента или экспрессивной манерой общения», — описывают алгоритм работы своего речевого сервиса в «МегаФоне».
В августе 2021 года компания запустила решение «Разговор на повышенных тонах». Оно интегрировано в «Виртуальную АТС» — сервис «умной» телефонии для малого и среднего бизнеса.
Система, обученная на 30 тыс. разговоров общей длительностью 750 часов, умеет считывать человеческие эмоции. Причем ориентируется она не на громкость речи, которая не всегда сигнализирует о конфликтной ситуации, а на изменение тональности разговора. Алгоритмы машинного обучения оценивают колебания звуковой волны с помощью спектрального анализа звуковых файлов.
Менеджер контакт-центра, в котором используется такой сервис, может прослушать отобранные записи, оценить работу оператора и при необходимости доработать скрипты.
В небольших компаниях записи часто прослушивает руководство, и сервис значительно сэкономит время, которое на это тратится: в фокус попадают только разговоры, требующие внимания. Если на сотрудника поступила жалоба от клиента, не придется слушать разговор целиком — можно сосредоточиться на конфликтном участке.
По словам представителей «МегаФона», компания планирует и дальше развивать сервис, чтобы система распознавала полутона человеческой речи еще точнее. Она будет постоянно обучаться на новых датасетах записей бесед и обратной связи от клиентов. Оператор также хочет расширять возможности по интерпретации полученных данных.
Какие возможности дает аналитика
Этот рост опирается на целый ряд возможностей, которые дает бизнесу новый инструмент.
Сочетание технологий разговорного ИИ, анализа текста и данных из различных цифровых каналов обеспечивает всестороннее понимание пути клиента к продукту или покупке, пишут специалисты Mordor Intelligence.
В качестве примера они приводят сервис Medallia Speech, который позволяет отслеживать впечатления клиентов в реальном времени на единой платформе. Сервис анализирует отклики клиентов по всем возможным каналам — голосовым, текстовым, видео — и умеет считывать эмоции.
Результаты исследования Oracle свидетельствуют, что 9 из 10 клиентов меняют бренд в первую очередь из-за плохого опыта взаимодействия. 86% потребителей готовы платить больше ради качественного обслуживания.
Разговорный ИИ дает возможность анализировать тон голоса, паузы и громкость речи. В итоге бизнес лучше понимает намерения и мотивацию потребителей.
По данным LiveVox, 98% взаимодействий с call-центрами остаются неконтролируемыми и непроверенными. Речевая аналитика позволяет расшифровать и оценить 100% звонков.
Благодаря технологиям на базе ИИ компания может точно узнать, с чем операторы не справляются. На основании этих данных можно разработать стратегию обучения персонала, чтобы обеспечить стабильное качество обслуживания.
Хорошая работа должна быть справедливо оценена и вознаграждена, добавляют в LiveVox. Использование речевой аналитики вселяет в сотрудников спокойствие и уверенность в том, что компания оценивает их усилия быстро и объективно. А это благотворно сказывается на уровне вовлеченности персонала.
Кроме того, менеджерам больше не нужно тратить время на анализ звонков в ручном режиме, их ресурсы можно перенаправить на более творческие задачи.
Речевая аналитика поможет бизнесу улучшить результаты за счет роста производительности и снижения издержек, отмечают в Velvetech. Так, на основе накопленных данных компания будет лучше управлять расходами фронт-офиса.
Разговорный ИИ также полезен при оценке спроса на определенные товары и услуги. Он позволяет понять, когда продукт можно снимать с продажи или, напротив, когда его лучше продвигать. «При правильном использовании речевая аналитика обычно окупается за три-девять месяцев», — говорит Донна Флюсс из DMG Consulting.
Аналитики Gartner указывают, что хайп вокруг технологий речевой аналитики постепенно сходит на нет. Время, когда ожидания от технологии завышены, а перспективы ее внедрения до конца ясны, остается в прошлом.
По их мнению, на горизонте от двух до пяти лет разговорный ИИ выйдет на плато продуктивности. Здесь риски для крупного бизнеса минимальны, но выгода от использования высока. А следом за корпорациями новый инструмент массово освоят малые и средние компании.
Как работают рекомендательные системы музыкальных сервисов
Нейросети хорошо научились работать с изображениями, видео и текстами — они распознают лица, эмоции, создают правдоподобные дипфейки, переводят онлайн, генерируют человеческую речь. Но есть область в которой глобально они бессильны — это музыка. Конечно, все пишут о магии Spotify — когда сервис советует какие-то новые неизвестные треки, которые удивительным образом нам нравятся. Как на самом деле работают алгоритмы Spotify, «Яндекс.Музыки» и Apple Music? Могут ли они создавать новую великую музыку или даже воскрешать умерших музыкантов и продолжить писать за них?
Коллаборативная фильтрация
Первое и основное, что делают все, — коллаборативная фильтрация. Что это такое? Алгоритм видит, что нравится вам, и видит, и что нравится другим. Он находит похожих пользователей и предлагает им как бы обменяться треками, которые они не слышали.
Представьте, что происходит когда алгоритму известны предпочтения сотен миллионов пользователей. К тому же, как отчитываются Spotify, они каждый день получают до 5 млрд цифровых взаимодействий. Точность попадания становится практически идеальной.
Но с коллаборативной фильтрацией есть две проблемы:
Проблема с холодными пользователями решается просто — новичками после регистрации предлагают рассказать, кого они слушают. После этого система понимает, что можно предложить конкретному пользователю. А если пользователь не хочет отвечать на вопросы, ему накидывается средняя популярная музыка, и система смотрит на реакцию. Если пользователь переключает трек, алгоритм понимает — не зашло, и подбрасывает что-то из другого жанра. Своими действиями холодный пользователь обучает систему, и она уже понимает, что ему предложить, чтобы он не ушел с сервиса.
Главный принцип коллаборативной фильтрации — explore and exploit — исследовать и использовать. Использовать — пользовательскую историю, его плейлисты, поведение — прослушали ли вы песню полностью, пропустили или лайкнули. А исследуют алгоритмы информацию о других пользователях: их плейлисты и любимых исполнителей.
А что насчет холодных треков? Как алгоритмы работают с ними?
Но разложить песню на ДНК у машины до конца пока не получается — так же, как из мельчайших частей написать что-то новое.
По словам руководителя лаборатории машинного обучения «Яндекса» Александра Крайнова, генерировать текст для машины гораздо легче, чем музыку: «В тексте есть символы, есть некоторая закономерность. Символы — это уже закодированная, сжатая информация. С изображением тоже просто, просто потому что там объем данных меньше. А звук — он большой, сложный, у него очень длинные и большие временные зависимости. В звуке очень много чего может объединяться: кто-то петь начинает на заднем плане, то есть это не просто звук голоса, а слова».
Могут ли машины самостоятельно писать музыку?
Например, год назад вышла песня, созданная алгоритмом, который обучали на хитах «Евровидения». Называется «Синие джинсы и кровавые слезы».
Но, конечно, финальный вариант все равно докручивали люди.
«Нейронные сети замечательно умеют генерировать картины, например. Нейронные сети хорошо генерируют человеческую речь: то, как Алиса говорит, — это целиком и полностью сгенерированная нейронной сетью речь», — говорит Александр Крайнов. Но в написании музыки «от и до» заметного прорыва пока нет. В основном все заметные проекты генерируют потоковую музыку из семплов: собирается готовая библиотека звуков, а программисты придумывают алгоритмы — то есть по каким законам эти семплы будут складываться в музыку. И математические формулы создают бесконечный поток музыки. Например, российский сервис по генерации музыки Mubert работает именно по такому принципу.
Может ли нейросеть проанализировать творчество уже ушедших из жизни музыкантов, понять, какие законы они использовали у себя в музыке, и попробовать написать что-то новое под них? Способна ли нейросеть написать новую песню за «Кино», за Queen, за «Сектор Газа»? По мнению основателя Mubert Алексея Кочеткова, теоретически да, но для этого нужно несколько нейросетей: одна будет петь, другая — играть на гитаре, например. Но человек в этом процессе все равно необходим.
Многие наверняка видели ролик музыканта Кирилла Нечаева. Он взял исследование «Яндекс.Музыки», в котором они проанализировали тексты исполнителей русского рэпа.
Но одно дело — написать текст, совсем другое — музыку. И пока нейросеть не в состоянии сотворить шедевр.
Что еще почитать по теме:
Подписывайтесь на Telegram-канал РБК Тренды и будьте в курсе актуальных тенденций и прогнозов о будущем технологий, эко-номики, образования и инноваций.