§ 64. Движение в живой природе
Монада, точка малая средь вод,
Без ног, без членов плавает, снует,
Там вибрион, как угорь вьется,
Живым мерцает колесом Сувойка,
А там играет формами Протей,
То шар, то куб, то будто червь иль змей.
Э. Дарвин
Какой механизм лежит в основе движения живых организмов? Как действуют биологические моторы? Как работают мышцы? Каков механизм движения отдельных клеток и одноклеточных организмов?
Урок-лекция
МНОГООБРАЗИЕ ФОРМ ДВИЖЕНИЯ ЖИВОГО. Движение — одно из фундаментальных свойств живого. В повседневной жизни мы сталкиваемся в основном с движением, которое осуществляется благодаря работе мышц; это и бег коня, и полет бабочки, и ползание дождевого червя, и плавание карася. В основе этих внешне столь различных форм движения лежит активность мышечных волокон. Но не только сокращение мышц обеспечивает движение. Одноклеточные организмы, например амебы, жгутиконосцы, инфузории, тоже обладают способностью к перемещению в пространстве. Перемещения разного рода осуществляются и внутри самих клеток: движение вакуолей, транспортных пузырьков, содержащих выработанный клеткой секрет, расхождение хромосом делящейся клетки. Есть ли что-либо общее между всеми этими столь различными на первый взгляд процессами?
ПРИЧИНЫ ДВИЖЕНИЯ ЖИВОГО. Из приведенных выше примеров следует, что движение живых организмов является механическим движением, а причиной любого механического движения являются силы. В частности, причиной движения планет является гравитационная сила Солнца. Причиной движения двигателей, построенных человеком, являются либо электромагнитные силы (электродвигатели), либо сила давления горячего газа на поршень (тепловые двигатели). Что же является причиной движения живых организмов?
Как вам уже известно, субстратом жизни служат полимерные молекулы белков и нуклеиновых кислот. Все процессы в живом организме происходят вследствие химических реакций между этими и другими молекулами, составляющими живой организм или поступающими в организм. Каким же образом химические превращения способны вызвать механическое движение?
Раскадровка движения балерины
Среди различных белков, составляющих организм, важную роль играют молекулы, получившие название белки — молекулярные моторы Характерным свойством таких молекул является способность изменять свою форму, т. е. взаиморасположение отдельных составляющих молекулы. Примером такого белка является молекула миозина, которая при наблюдении в электронный микроскоп видна как короткая толстая нить с утолщением-головкой на одном из концов. Эта головка способна поворачиваться относительно нити (рис. 73).
Рис. 73. Движение головки миозина
Если головку прикрепить к какой-либо другой молекуле, при повороте она способна совершать механическую работу. Откуда берется энергия для такой работы? Энергию поставляет молекула АТФ — универсальный источник энергии клеток всех живых организмов.
Однако при движении головки относительное изменение длины молекулы миозина оказывается незначительным. Мышцы, созданные из таких молекул, могли бы сокращаться на единицы процентов (реальное сокращение мышц может доходить до 50%). И природа «исхитрилась» создать мотор, работающий по циклу, подобно тепловым двигателям, созданным человеком. Правда, произошло это за миллиарды лет до создания человеком тепловых двигателей. Биологический двигатель состоит из двух молекул — миозина, осуществляющего движение, и актина, молекулы которого, соединяясь между собой, образуют длинные тонкие нити. Рабочий цикл актин-миозинового мотора схематично изображен на рисунке 74.
Рис. 74. Схема рабочего цикла актин-миозинового мотора
Следует отметить, что КПД такого двигателя (отношение совершенной механической работы к затраченной энергии) в несколько раз превосходит КПД тепловых двигателей, созданных человеком. Человек еще не достиг совершенства, имеющегося в природе; возможно, двигатели, подобные биологическим, будут изобретены в будущем.
Биологические моторы основаны на взаимодействии двух типов молекул: молекулы, изменяющей форму, и перемещаемой молекулы. Эти молекулярные комплексы ра-циклично и обусловливают все движения, которые наблюдаются в живой природе.
Что же регулирует циклическую работу биологического двигателя? Под воздействием нервного импульса в цитоплазме увеличивается концентрация ионов Са 2+ . Они способствуют контакту актина с миозиновой головкой и соединению миозина с одной из составляющих молекулы АТФ (в определенном смысле действие ионов кальция подобно действию катализаторов при химической реакции). После того как миозиновая головка совершила очередное тянущее движение, концентрация ионов кальция уменьшается (см. рис. 74).
МЫШЕЧНОЕ СОКРАЩЕНИЕ. Рассмотрим работу мышцы. Схема мышцы приведена на рисунке 75. Мышечные волокна, имеющие диаметр порядка 50 мкм, состоят из отдельных цилиндрических структур — миофибрилл, которые имеют диаметр 1—2 мкм.
Рис. 75. Схема строения мышцы
Если сделать поперечный срез миофибриллы и взглянуть на него через электронный микроскоп, то можно увидеть правильно чередующиеся тонкие нити белка актина и толстые, связанные в пучок своими хвостовыми концами молекулы миозина. При зацеплении головки миозина за актиновую нить образуются поперечные мостики.
Основу работы мышцы составляет работа множества элементарных актин-миозиновых биологических моторов.
Схема работы отдельной сократимой единицы миофибриллы приведена на рисунке 76.
Рис. 76. Схема работы миофибриллы: расслабленное состояние (а), сокращенное состояние (б)
В расслабленном состоянии мышцы миозиновые и актиновые нити перекрываются незначительно. После нескольких циклов актин-миозиновых моторов актиновые нити оказываются втянутыми в промежутки между миозиновыми нитями, что приводит к сокращению мышцы.
УНИВЕРСАЛЬНЫЙ ХАРАКТЕР БИОЛОГИЧЕСКОГО ДВИЖЕНИЯ. Описанные биологические моторы обусловливают различные движения живых организмов. Примерами таких движений являются изменение формы клетки и образование перетяжки между дочерними клетками в ходе клеточного деления, движение жгутиков и ресничек простейших живых организмов (жгутиконосцы, инфузории), амебовидное движение — один из самых распространенных способов перемещения клеток.
Исследование амебоидного движения показало, что в прилежащем к наружной плазматической мембране амеб слое цитоплазмы имеется сеточка из нитей актина и миозина. Сокращение и расслабление этой сеточки фактически изменяет упругость наружной оболочки, в результате чего цитоплазма перетекает в область, где эта упругость меньше. В этой области образуется вырост — псевдоподия, которая закрепляется на окружающих амебу телах. Затем вещество амебы постепенно перекачивается в область, где закрепилась псевдоподия, после чего цикл повторяется.
Подобный способ движения характерен также для лейкоцитов — элементов крови человека и позвоночных животных — участвующих в иммунном ответе организма. Перемещаясь, как амебы, эти клетки скапливаются вокруг проникших в организм инородных объектов и нейтрализуют их вредное воздействие на организм,
Движение при помощи жгутиков и ресничек чрезвычайно распространено среди одноклеточных организмов. Изгибаясь, жгутики и реснички совершают сложное движение. Движение жгутика напоминает движение гребного винта. Движение реснички напоминает движение рук человека, плывущего брассом: вначале следует прямой удар ресничкой, затем она изгибается и медленно возвращается в исходное положение.
Несмотря на огромное разнообразие форм движения живых существ, все они оказываются достаточно сходными и основанными на одних и тех же молекулярных механизмах.
Жгутики и реснички не содержат мышц. Под микроскопом видно, что жгутики и реснички состоят из микротрубочек, образованных молекулами белков. К каждой микротрубочке прикреплены ручки, образованные белком — молекулярным мотором (рис. 77).
Рис 77. Схема, иллюстрирующая механизм изгибания жгутиков и ресничек
Цикл движения состоит в том, что ручки микротрубочки цепляются за соседнюю микротрубочку, затем, изгибаясь, подтягивают соседнюю микротрубочку, после чего, отцепляясь, возвращаются в исходное положение. Таким образом, функцию актина в актин-миозиновом комплексе в данном случае выполняют микротрубочки. Если микротрубочки одним концом скреплены между собой, то при циклическом движении ручек происходит изгиб микротрубочек.
- Как осуществляется механическое движение в живой природе?
- Можно ли найти что-то общее в беге леопарда и ползании амебы? Если да, то что?
- За счет какого вида энергии совершается механическая работа при действии биологического мотора?
Имплантируемая система вспомогательного кровообращения на основе управляемого вентильного двигателя, интегрированного с насосом крови мембранного типа Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»
СИСТЕМЫ ВСПОМОГАТЕЛЬНОГО КРОВООБРАЩЕНИЯ / SYSTEMS OF ANXILIARY CIRCULATION OF THE BLOOD / ВЕНТИЛЬНЫЙ ДВИГАТЕЛЬ / BRUSHLESS DC MOTORS / ПРЕОБРАЗОВАТЕЛЬ ВИДА ДВИЖЕНИЯ / ПЕРЕДАТОЧНОЕ ОТНОШЕНИЕ РЕДУКТОРА / TRANSMISSION RATIO OF REDACTOR / МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ / MATHEMATICAL MODELING / MOTION CONVERTER
Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Куликов Николай Иванович, Куприянов Андрей Дмитриевич
В статье изложены вопросы оптимального проектирования управляемого реверсивного вентильного двигателя на основе системного подхода к разработке привода насосов крови пульсирующего типа.
i Надоели баннеры? Вы всегда можете отключить рекламу.
Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Куликов Николай Иванович, Куприянов Андрей Дмитриевич
Массоэнергетические характеристики электромеханического привода насоса крови системы вспомогательного кровообращения с пульсирующим кровотоком
Применение компьютерных технологий при проектировании специализированных вентильных двигателей
Расчет мощности электродвигателя компенсации потерь стенда испытаний хвостового вала вертолёта
Способы контроля состояния тормозов механизмов подъема грузоподъёмных машин
Электропривод рулевого механизма
i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.
Implantable assist circulation system based on controlled brushless motor integrated with the blood pump membrane
The questions of optimization of the parameters controlled valve engine used as a drive for implantable blood pump systems assist circulation with pulsating blood flow. Proposed optimization criteria and developed recommendations for the design of reverse drive pumps blood pulsating type.
Текст научной работы на тему «Имплантируемая система вспомогательного кровообращения на основе управляемого вентильного двигателя, интегрированного с насосом крови мембранного типа»
Н. И. Куликов, канд. техн. наук, д-р биол. наук, А. Д. Куприянов, канд. техн. наук,
ГОУ ВПО «Московский авиационный институт (Государственный технический университет)
Имплантируемая система вспомогательного кровообращения на основе управляемого вентильного двигателя, интегрированного с насосом крови мембранного типа
Ключевые слова: системы вспомогательного кровообращения, вентильный двигатель, преобразователь вида движения, передаточное отношение редуктора, математическое моделирование.
Key words: systems of anxiliary circulation of the blood, brushless DC motors, motion converter, transmission ratio of redactor, mathematical modeling.
В статье изложены вопросы оптимального проектирования управляемого реверсивного вентильного двигателя на основе системного подхода к разработке привода насосов крови пульсирующего типа.
Сердечная недостаточность (СН) осложняет течение сердечно-сосудистых заболеваний у 2—3 % населения развитых стран; при выраженной ее степени летальность в течение 5 лет достигает 75 %. Расходы на лечение СН составляют 1—2 % бюджета здравоохранения стран Западной Европы и США. По результатам многочисленных исследований, проведенных компаниями «Cibis», «Atlas», «Prover», «Radiance», «Support», было установлено, что стоимость хирургического лечения хронической СН ниже, чем стоимость госпитализаций и медикаментозного лечения.
Кроме того, кардиологи всего мира вынуждены ставить диагноз критической, устойчивой к медикаментозной терапии сердечной недостаточности почти у 2,5 млн пациентов ежегодно. При применении самых мощных схем терапевтического лечения достигается лишь временный эффект.
Таким образом, проблема хирургического лечения терминальной сердечной недостаточности занимает одну из ведущих научных позиций в современной кардиологии. Перспективным методом хирургического лечения критической СН является использование механических систем вспомогательного кровообращения — искусственных желудочков сердца (ИЖС), полностью или частично замещающих функцию пораженного сердца.
Под понятием «системы вспомогательного кровообращения» (СВК) следует понимать механиче-
ские системы, производящие перемещение крови с целью снижения работы миокарда и/или увеличения его энергоснабжения. Исходя из этого, задачи системы вспомогательного кровообращения сводятся к следующему: снижение работы миокарда (за счет подключения СВК) и увеличение снабжения его и других органов кислородом (за счет улучшения коронарной и системной перфузии, т. е. системный кровоток складывается из суммы естественного выброса сердца и выброса насоса).
Одним из вариантов СВК является система, содержащая электромеханический привод, интегрированный с мембранным насосом крови, систему управления, обеспечивающую регулирование режимов привода, и аккумуляторный источник питания. При этом привод с насосом имплантируется в брюшную полость, а система управления с источником питания укрепляется на поясе пациента.
Статья посвящена вопросам разработки именно таких систем.
Имплантируемый электромеханический модуль (рис. 1) рационально выполнять на базе реверсивного вентильного (бесконтактного) двигателя с возбуждением от постоянных магнитов. Статор двигателя содержит пакет зубцового якоря с размещенной в пазах диаметральной сосредоточенной трехфазной обмоткой якоря.
С целью преобразования вращательного движения ротора в возвратно-поступательное движение толкателя вал ротора выполнен полым с таким расчетом, чтобы ротор составлял единую интегральную конструкцию с преобразователем вида движения [1].
Преобразователь вида движения построен по принципу несоосной ролико-винтовой передачи,
1 — мембрана; 2 — насос крови; 3 — толкатель; 4 — двигатель
состоящей из винта, резьбовых роликов и резьбовой гайки, запрессованной в полый вал двигателя. Рабочий конец винта через специальную муфту соединен с толкателем, воздействующим на мембрану насоса крови, жестко установленного на корпусе электромеханического модуля. Во избежание проворота толкателя вокруг оси вращения в конструкции модуля предусмотрен стержневой фиксатор, выполненный на основе скользящей опоры. Индуктор двигателя выполнен из профилированных постоянных магнитов, установленных на ярме индуктора в чередующейся полярности. Для достижения высоких удельных показателей индуктор выполнен из закритических магнитов с высокой удельной энергией и содержит три пары полюсов. Для обеспечения механической прочности на роторе установлен бандаж в виде тонкостенного стакана из немагнитного материала. Коммутация фаз обмотки якоря осуществляется трехфазным мостовым инвертором, силовые ключи которого управляются сигналами от чувствительных элементов датчиков положения ротора. В качестве таких элементов в электромеханическом модуле использованы датчики Холла, установленные на лобовых частях обмотки якоря и управляемые потоком рассеяния индуктора.
Напряжение питания к обмоткам якоря и элементам Холла подводится по кабелю, герметизированный ввод которого установлен на корпусе модуля. Для обеспечения циркуляции воздуха в герметичном рабочем объеме модуля кабель пропущен через тонкостенную трубку. Соединение модуля с блоком управления осуществляется через специальный электрический разъем, жестко закрепленный на конце кабеля.
Макетный образец имплантируемой электромеханической части системы (рис. 2), осуществляющей перемещение толкателя мембраны насоса крови по заданному закону, выполнен на базе вентильного двигателя со встроенной ролико-винтовой передачей. Двигатель должен обеспечить циклическое перемещение толкателя (ход толкателя — 20 мм) с частотой сердечных сокращений от 40 до 120 уд./мин
Макетный образец имплантируемой части системы ВК
при соотношении «время систолы/время диастолы», принимающем значения 1/1, 1/2, 1/3.
Для определения путей улучшения энергетических показателей привода целесообразно провести анализ основных компонентов, влияющих на энергопотребление. Оставим потери и КПД двигателя, так как они определяются во многом требованиями к габаритным размерам.
Потребляемая мощность за вычетом потерь в обмотке якоря представляет собой электромагнитную мощность, которая расходуется на изменение кинетической энергии ротора (разгон-торможение) и выполнение полезной работы. Составляющие потребляемой мощности, затрачиваемой на разгон и торможение инерционной массы, а также на преодоление толкателем кровяного давления, полученные в процессе моделирования при гармоническом законе управления, представлены на рис. 3.
Расчет проведен для режима с ЧСС = 60 уд./мин, С = 1/2 (^ = 1/3 с) и перемещением толкателя, равным 20 мм, при непрерывном сигнале обратной связи и трапецеидальном законе управления.
Из графиков видно, что большая часть энергии расходуется на разгон и торможение ротора, т. е.
Зависимость потребляемой мощности от времени (шаг РВП Н = 1,125 мм):
1 — мощность, затрачиваемая на разгон-торможение инерционной массы ротора; 2 — мощность, затрачиваемая на преодоление толкателем давления крови
потребляемая мощность в данном случае расходуется неэффективно. Рационально часть энергии, приобретенной приводом при разгоне, использовать для совершения полезной работы.
Проведенный анализ показал, что для создания привода системы ВК, соответствующего техническим требованиям и в то же время имеющего более высокие энергетические показатели, чем у макетного образца, необходимо сократить энергопотребление, связанное с разгоном и торможением привода, и расширить диапазон реализуемых режимов работы.
Расширить диапазон реализуемых режимов работы привода можно следующими способами:
1) увеличить напряжение питания;
2) уменьшить потокосцепление двигателя за счет сокращения числа витков обмотки якоря (можно уменьшить сопротивление ОЯ и увеличить пусковой момент) или/и использования постоянных магнитов с худшими свойствами;
3) использовать не синусоидальный, а трапецеидальный закон управления скоростью двигателя;
4) увеличить передаточное отношение редуктора, т. е. шаг винта.
Расширение диапазона реализуемых режимов работы привода 1-м и 2-м способами нельзя считать рациональным, так как при этом происходит увеличение потребляемой мощности, затрачиваемой на разгон-торможение, что приведет к дальнейшему уменьшению КПД системы.
Расчеты показали, что трапецеидальный закон управления позволяет примерно на 30—40 % расширить диапазон реализуемых режимов, но вместе с тем из-за необходимости увеличения dm/dt в процессе разгона и торможения потребуется увеличить значение потребляемой мощности в переходных режимах. Кроме того, вероятно возникновение перерегулирования, что, в свою очередь, также приводит к увеличению потребления.
Для минимизации составляющих мощности, затрачиваемой на разгон и торможение ротора, можно уменьшить момент инерции ротора либо уменьшить необходимую частоту его вращения (за счет увеличения передаточного отношения редуктора). Уменьшение момента инерции ротора связано с необходимостью перехода на ролико-винтовую пару малого диаметра, что резко снизит ее надежность.
Наиболее рациональным способом, позволяющим решить поставленные задачи, является увеличение передаточного отношения редуктора. Для расчета зависимости среднеквадратичного значения потребляемой мощности системы от шага ролико-винтовой пары разработанная математическая модель системы была полностью реализована в виде mat-файла, т. е. процедуры, которая может многократно вызываться из тела основной программы.
Выбор передаточного отношения редуктора рационально осуществлять по критерию минимума
1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 к, мм Рис. 4 I Зависимость потребляемой мощности от шага РВП
потребляемой мощности на заданном режиме работы С ЧСС = 60 уд./мин, = 1/2, и ходом толкателя I = 20 мм.
Зависимость потребляемой мощности от шага РВП для данного режима представлена на рис. 4. Расчет проводился при непрерывном сигнале обратной связи с неизменным значением коэффициента усиления регулятора. Параметры модели соответствуют макетному образцу системы ВК.
Из приведенной зависимости видно, что с увеличением шага РВП с 1,125 до 3,7 среднеквадратичное значение потребляемой мощности за период сокращается более, чем в 3 раза. Составляющие мощности при шаге РВП = 3,7 мм, затрачиваемой на разгон и торможение инерционной массы, а также преодоление толкателем кровяного давления, приведены представлены на рис. 5.
Необходимо отметить, что с увеличением угла подъема резьбы КПД передачи «винт-гайка» увеличивается. Однако при этом происходит значительное уменьшение информации о реальном
Зависимость потребляемой мощности от времени (шаг РВП к = 3,7 мм):
1 — мощность, затрачиваемая на разгон-торможение инерционной массы ротора; 2 — мощность, затрачиваемая на преодоление толкателем давления крови
положении ротора, что может привести к росту пульсаций скорости и неустойчивой работе системы на низких ЧСС. В связи с этим шаг РВП следует выбирать с учетом дискретного сигнала обратной связи, а также значения коэффициента усиления. При этом должны выполняться требования по точности отработки задающего воздействия и пульсациям скорости.
Оптимизация системы электропривода предполагает обоснование и выбор критерия оптимальности, варьируемых параметров и накладываемых ограничений, т. е. формирование целевой функции. Решение оптимизационной задачи заключается в выборе метода оптимизации, реализации расчетной модели и проведении оптимизационных расчетов на основе сформулированной целевой функции. Исходными данными для моделирования и оптимизации являются параметры макетного образца системы.
Задачу синтеза оптимального привода можно поставить следующим образом: определить параметры привода, а также структуру и параметры системы управления оптимальные или близкие к оптимальным с точки зрения энергопотребления и удовлетворяющие требованиям технического задания. При этом в качестве исследуемых режимов для определенности принято:
1) ЧСС — 60 уд./мин; отношение — 1/2; ход толкателя — 20 мм;
2) ЧСС — 120 уд./мин; отношение — 1/3; ход толкателя — 20 мм;
3) ЧСС — 40 уд./мин; отношение — 1/1; ход толкателя — 20 мм.
В результате оптимизации необходимо определить значения шага РВП и коэффициента усиления СУ, обеспечивающие минимальное энергопотребление (например, для режима с ЧСС — 60 уд./мин, отношением — 1/2, и ходом толкателя — 20 мм). При этом значение относительного рассогласования по перемещению на момент времени t = ( tsis + i^ias) не должно превышать 5 %, а максимальное значение относительного рассогласования по скорости — 20 %. Полученные в результате оптимизации параметры должны удовлетворять требованиям ТЗ во всем диапазоне изменения ЧСС и соотношения
Таким образом, критерием оптимальности является среднеквадратичное значение потребляемой мощности за период, варьируемыми параметрами — шаг РВП и коэффициент усиления; в качестве ограничений выступают максимальные за период значения относительных рассогласований по перемещению и скорости. Из всего многообразия оптимизационных методов и алгоритмов для решения поставленной задачи целесообразно использовать симплексный метод (метод Нелдера—Мида), являющийся одним из самых эффективных методов оптимизации, при количестве варьируемых параметров не более пяти [2].
В качестве стартовой точки были использованы параметры макетного образца. При оценочном расчете системы (без учета дискретности сигнала обратной связи) были получены следующие оптимальные значения варьируемых параметров: кус = 3,1 В/рад; Н = 3,7 мм.
Полученное значение шага хорошо согласуется с данными, приведенными на рис. 4.
Потребляемая мощность и точность отработки задающего воздействия в значительной степени зависят от количества информации о реальном положении ротора. По этой причине была проведена серия оптимизационных расчетов, позволяющая определить оптимальные значения коэффициента усиления и шага редуктора при различном количестве информации с ДПР. Количество информации с ДПР задается углом поворота ротора, по прошествии которого приходит очередной импульс сигнала обратной связи.
Для повышения точности отработки задающего воздействия можно осуществить следующее:
1) увеличить число сигналов обратной связи путем увеличения числа ДПР или числа пар полюсов приводного двигателя;
2) ввести систему коэффициентов усиления для различных режимов;
3) использовать самонастраивающуюся систему;
4) использовать иной принцип управления (не пропорциональное управление, а комбинированное).
Наиболее рациональным является проектирование двигателя с большим числом пар полюсов, при этом система управления двигателем и система обратной связи по положению мембраны насоса крови оказывается наиболее простой.
Проведенные исследования позволили сформулировать рекомендации по разработке привода.
i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
1. При условии сохранения момента инерции шаг редуктора целесообразно увеличить до 2,5. 3,7 мм. Предпочтение следует отдавать меньшим значениям, так как при незначительном увеличении потребляемой мощности для меньших значений диапазона можно обеспечить больше информации обратной связи и соответственно более устойчивую работу привода на низких ЧСС.
2. При проектировании двигателя необходимо обеспечить максимально возможное число пар полюсов, сохранив при этом массогабаритные показатели.
3. Номинальные параметры двигателя следует выбирать на основе построения совместных механических характеристик привода и нагрузки при выбранном значении шага редуктора.
На основе этих рекомендаций была проведена серия расчетов вентильного двигателя. При расчетах использовалось программное обеспечение, основанное на уточненной методике расчета ВД. В основе методики лежит классическая теория расчета электрических машин и, в частности, электрических
машин с постоянными магнитами [3]. Ее отличие от традиционных методик заключается в использовании при расчете магнитного поля аналитических решений полевых задач [3—5] и последующем решении системы дифференциальных уравнений, описывающих процессы в обмотке якоря на коммутационном интервале. Это позволяет более точно определять значения потока возбуждения, а так же среднего и действующего значений тока, которые входят в выражения для определения момента, частоты вращения и потерь в обмотке. Результатом расчета являются значения момента и частоты вращения, обеспечивающие заданную номинальную мощность. По окончании расчета создается файл, содержащий данные для построения рабочих и механической характеристик.
Расчеты привода показали, что для увеличения числа пар полюсов р с 3 до 6—7 требуется перейти к укороченной обмотке с числом пазов на полюс и фазу q = 0,5 и увеличить диаметр расточки до 38 мм. Предпочтение было отдано р = 6, так как в данном случае проще обеспечить необходимую точность при изготовлении втулки ротора. Значение шага редуктора принято равным 3,75 мм.
В отличие от проектирования классических электрических машин, у которых максимум КПД обеспечивается при равенстве постоянных и переменных потерь, в приводном двигателе системы ВК, большую часть времени работающего на скоростях, в несколько раз меньших номинальной, целесообразно обеспечить потери в меди в несколько раз меньшими потерь в стали, т. е. делать двигатель «медным».
Исходными данными для расчета приводного двигателя являются:
— номинальная мощность — 30 Вт;
— напряжение питания — 10 В;
— частота вращения двигателя, обеспечивающая отработку режима 120 уд./мин при С = 1/3 для редуктора с шагом 3,7 мм — п = 4000 об/мин;
— число пар полюсов р = 6.
В результате расчета были получены следующие параметры приводного двигателя:
— сопротивление фазы Иф = 0,0437 Ом;
— потокосцепление фазы Тф = 0,002121 Вб;
— частота вращения при номинальной нагрузке п = 4200 об/мин;
— потери в стали при номинальной частоте вращения ЛРст = 9,1 Вт.
Совместная механическая характеристика разработанного приводного двигателя и нагрузки для режима с ЧСС = 120 уд./мин приведена на рис. 6. Из приведенных зависимостей видно, что привод в состоянии реализовать все режимы работы, сформулированные в ТЗ.
В результате проведенной оптимизации с ограничениями получены оптимальное значения шага к = 4,2 и коэффициента усиления к = 1,8; при этом среднеквадратичное значение потребляемой мощности за период составило 4,8 Вт.
На рис. 7, а—в представлены зависимости заданных и расчетных значений углового перемещения толкателя I, частоты вращения ротора п и потребляемой мощности Р от времени для режима
1400 1200 1000 800 600 400 200 0
Причины движения живого
Из приведенных выше примеров следует, что движение живых организмов является механическим движением, а причиной любого механического движения являются силы. В частности, причиной движения планет является гравитационная сила Солнца. Причиной движения двигателей, построенных человеком, являются либо электромагнитные силы (электродвигатели), либо сила давления горячего газа на поршень (тепловые двигатели). Что же является причиной движения живых организмов?
Как вам уже известно, субстратом жизни служат полимерные молекулы белков и нуклеиновых кислот. Все процессы в живом организме происходят вследствие химических реакций между этими и другими молекулами, составляющими живой организм или поступающими в организм. Каким же образом химические превращения способны вызвать механическое движение?
Среди различных белков, составляющих организм, важную роль играют молекулы, получившие название белки — молекулярные моторы. Характерным свойством таких молекул является способность изменять свою форму, т. е. взаиморасположение отдельных составляющих молекулы. Примерам такого белка является молекула миозина, которая при наблюдении в электронный микроскоп видна как короткая толстая нить с утолщением-головкой на одном из концов. Эта головка способна поворачиваться относительно нити.
Если головку прикрепить к какой-либо другой молекуле, при повороте она способна совершать механическую работу. Откуда берется энергия для такой работы? Энергию поставляет молекула АТФ — универсальный источник энергии клеток всех живых организмов.
Однако при движении головки относительное изменение длины молекулы миозина оказывается незначительным. Мышцы, созданные из таких молекул, могли бы сокращаться на единицы процентов (реальное сокращение мышц может доходить до 50%). И природа «исхитрилась» создать мотор, работающий по циклу, подобно тепловым двигателям, созданным человеком. Правда, произошло это за миллиарды лет до создания человеком тепловых двигателей. Биологический двигатель состоит из двух молекул — миозина, осуществляющего движение, и актина, молекулы которого, соединяясь между собой, образуют длинные тонкие нити.
Следует отметить, что КПД такого двигателя (отношение совершенной механической работы к затраченной энергии) в несколько раз превосходит КПД тепловых двигателей, созданных человеком. Человек еще не достиг совершенства, имеющегося в природе; возможно, двигатели, подобные биологическим, будут изобретены в будущем.
Что же регулирует циклическую работу биологического двигателя? Под воздействием нервного импульса в цитоплазме увеличивается концентрация ионов Ca 2+ . Они способствуют контакту актина с миозиновой головкой и соединению миозина с одной из составляющих молекулы АТФ (в определенном смысле действие ионов кальция подобно действию катализаторов при химической реакции). После того как миозиновая головка совершила очередное тянущее движение, концентрация ионов кальция уменьшается.
Биологические моторы основаны на взаимодействии двух типов молекул: молекулы, изменяющей форму, и перемещаемой молекулы. Эти молекулярные комплексы работают циклично и обусловливают практически все движения, которые наблюдаются в живой природе.
Читать далее
Предметы
- Астрономия
- Биология
- География
- Допризывная подготовка (Беларусь)
- Естествознание
- Информатика
- История Древнего мира
- История Словакии
- История Средних веков
- Легкая атлетика
- Обществоведение
- Туризм
- Физика
- Фотография
- Человек и мир
Искусственные и биологические нейронные сети
Это можно сравнить с поиском Священного грааля, поиск алгоритма, по которому работают биологические нейронные сети. Конечно многие скажут, что никакого грааля не существует, это всё легенды, и в искусственных нейронных сетях уже всё реализовано, осталось дождаться развития этой технологии, вычислительных ресурсов и. и всё — настоящий искусственный интеллект будет создан. А, разбираться в сложном и запутанном органе для этих целей нет необходимости. Но, надеюсь есть добрая доля искателей приключений, которым будет интересны некоторые рассуждения где стоит искать этот “Священный грааль”. В статье мы проанализируем и сравним работу искусственных нейронных сетей с гипотезами о том, как работают биологические нейронные сети, и конечно, сопроводим это практическими опытами, разберем новую искусственную нейронную сеть, которая по своему принципу работы ближе к биологическому аналогу.
Как же работает искусственная нейронная сеть?
Начнём мы с анализа искусственных нейронных сетей. Нет, здесь не будет описаний принципов работы сетей, лучше о них расскажут другие многочисленные источники, здесь мы попытаемся понять некую фундаментальную суть их работы в части распознавания образов. Это очень наглядно демонстрирует одни простой пример: Представим сеть состоящую из двух частей энкодера и декодера, на вход которой будет подаваться примеры из набора рукописных цифр MNIST и на выходе соответственно дублируем вход. Обучать её будем классическим методом, обратным распространением ошибки. Самая узкая часть сети, самый маленький слой расположенный между энкодером и декодером будет иметь всего 2 нейрона. После обучения получится так, что эти 2 нейрона будут нести в себе информацию как, так скажем, кодировать образы множества начертаний всех цифр. Если по оси x разместить активность одного нейрона, а по y активность другого нейрона, то на диаграмме можно отметить какие точки соответствуют каждому классу, а с помощью декодера воспроизвести начертание цифры соответствующее точкам. Замечательный интерактивный пример этого можно попробовать здесь То, что мы получили, специалисты называют Малое Репрезентативное Представление (МРП), “малое” — потому, что у нас всего 2 вещественных числа отражают вектор из 784 вещественных чисел, а “репрезентативное” — оно потому, что отражает внутри сети внешний мир, то есть зная лишь эти два значения, мы можем оценить что в данный момент “видит” сеть, какую цифру и даже примерную форму её начертания. Можно сказать, что Малое Репрезентативное Представление (МРП) это некая модель мира, только сети пришлось сделать очень простую модель, малую, всего два числа, хотя внешний мир более сложен и представляет собой наборы из 784 вещественных чисел. Давайте взглянем подробнее, что из себя представляет эта Малое Репрезентативное Представление (МРП), мы видим несколько областей которые будут соответствовать определённым классам и соседние точки будут соответствовать очень близким по начертанию цифрам. Получается МРП может помочь существенно упростить процесс обучению распознавания. Мы можем взять обученный декодер, отбросив энкодер, добавить небольшой персептрон и достаточно быстро новую сеть научить распознавать рукописные цифры (это называется transfer learning, или перенос обучения), то есть сначала наша сеть, или её первая конфигурация обучалась только на изображениях без связи их с фактическим числом, такое вот самообучение (без учителя) для получения МРП, а затем следующая конфигурация используя полученное МРП, обучается на сопоставлении изображения и метки цифры, обучение с учителем, и делает это значительно быстрее, чем сеть которая будет обучаться сразу на сопоставлении. По сути здесь класс цифры определяется некоторыми диапазонами активности двух нейронов. Эти диапазоны или области как мы видим на диаграмме, можно назвать некими эмбеддингами, представительствами классов внутри сети, которые сформировались в процессе самообучения. Далее мы поговорит о том, что из себя представляет Малое Репрезентативное Представление (МРП) в биологических сетях, в мозге, как в нём представлены эти эмбеддинги, но для начала выделим некоторые качества этих сущностей для искусственных нейронных сетей. Во-первых, в МРП задействован слой целиком, все нейроны слоя имеют значение. Представим что мы убрали из сети один из двух нейронов, детектировать точно что “видит” сеть по одному нейрону будет проблематично, не всегда можно ответить даже на вопрос, а видит ли сейчас сеть, например, цифру “5”. Да, существует прунинг, но он возможен только при избыточном количестве нейронов, когда можно убрать нейроны без последствий для МРП. Во-вторых, чем больше нейронов в слое задействованном в МРП тем сложнее выделить фичи, так как каждый нейрон создает свое измерение в пространстве представительств классов, 2 нейрона — 2 измерения, 10 нейронов — 10 измерений… и все 10 будут взаимозависимы. В третьих, очевидная для искусственных сетей вещь, все нейроны слоя или даже всей сети, при каждом такте обучения вовлечены в него, каждый нейрон получит свою корректировку весов. В отличии от классических искусственных нейронных сетей в биологических сетях отражён нейроно-детекторный подход. В биологической сети нейрон выступает как детектор определённого признака или группы признаков. Можно сказать, что за фичи или эмбеддинги здесь отвечают отдельные нейроны. Это подтверждается многочисленными экспериментами, существует даже шуточное название для этого явления — “бабушкины нейроны”, которое говорит о том, что любому образу в нашем мозге будет соответствовать активность определенной клетки, не исключено даже наличие такой клетки для образа нашей бабушки. Конечно, когда мы говорим “нейрон” в данном случае, то подразумевается целая группа активных нейронов. Во-первых, прежде чем возбуждение достигнет пресловутого бабушкиного нейрона оно пройдет через ряд других нейронов, во-вторых, обычно за каким-либо образом стоит активность целой группы распределенных по коре нейронов, нейронного ансамбля или паттерна активности. Формальный нейрон искусственных сетей достаточно хорошо отражает принцип работы биологического нейрона, веса формального нейрона — отражают размеры порций медиатора выделяемые в синаптическую щель при активации синапса, а совокупное влияние нейромедиатора приводящие к возникновению потенциала действия отражено в пороговой функции формального нейрона. Всё замечательно, но при картировании первичной зрительной коры («Глаз, мозг, зрение» Хьюбел Дэвид, Торстен Визель) фиксируется активность нейронов на определенные раздражители, к примеру, различной ориентации линии, отрезки, концы отрезков. И дело здесь не в том, что нейроны коры работают по другим принципам, дело, скорее, в самой организации этих нейронов. В общем, можно сказать, что формальные нейроны искусственных сетей более эффективно работают с информацией чем биологические нейроны, например, как мы убедились, для кодирования множества начертаний рукописных цифр может потребоваться всего два нейрона, а при кодировании по нейроно-детекторному принципу потребуется минимум 10 нейронов хотя бы закодировать 10-ть классов цифр, не говоря уже о различных формах начертаний этих цифр. Тогда возникает резонный вопрос: зачем вообще пытаться понять этот принцип, зачем искать этот Грааль? Во-первых, работая над созданием модели нейронных сетей в которых будет применяться нейроно-детекторный подход мы можем больше узнать о принципах на которых работают биологические нейронные сети. Во-вторых, хоть эволюционный процесс не идеален и не всегда приводит к оптимальным решениям, но в вопросе сбережения энергии и эффективности работы мозга эволюция была успешна. При нейроно-детекторном подходе нет необходимости активировать все нейроны при обучении и работе модели, да, для математической модели это не даёт особых преимуществ в эффективности, а при реализации такой модели в ”железе” может дать существенно. В третьих, представьте насколько удобно использовать нейронную сеть состоящую из нейронов-детекторов, мы можем оценить о чём “думает” в данный момент сеть по активности нейронов, мы можем понять как она принимает решения, мы можем управлять этим решениями просто активировав нужные нейроны. В четвертых, возможность обучения с одного раза (one-shot learning). Если у Вас есть нейрон-детектор реагирующий на слово “стол” и нейрон-детектор реагирующий на изображение стола, Вам не составит труда создать между ними связь. В пятых, это была бы более стабильная модель в вопросе дообучения, переобучения (в хорошем смысле этого слова), а также физическом разрушении, если повредить нейрон-детектор ответственный за цифру “5”, оставшиеся нейроны позволяют на хорошем уровне распознавать цифры, банально из-за отсутствия тесного взаимодействия уровня активности нейронов при детекции. Еще несколько доводов в пользу перспектив таких сетей: это гибкость их управления в динамике, а значит возможность создавать алгоритмы высокоуровневого управления этих сетей, подобно тому как эмоциональные системы управляют памятью и реакциями в нервных системах животных и человека. Еще есть возможность оценить новизну поступающей информации на любом абстрактном уровне на котором работает сеть, если в нашей системе существует детектор который реагирует на внешний раздражитель, и мы можем оценить степень этой реакции, а значит оценить близость внешнего раздражителя к внутренней памяти системы, что и будет оценкой новизны. Если критерии новизны станут важными для управления нейронной сетью то, это должно приблизить нас пониманию того как создать настоящий искусственный интеллект, ведь в поведении человека и животных новизна это очень важный фактор.
Как кодируют информацию биологические нейронные сети?
Малым Репрезентативным Представлением (МРП) для мозга является SDR (Sparse Distributed Representation) или Разреженное Распределенное Представление (РРП). “Разреженное” — значит, что только небольшое число нейронов активны одновременно, а “распределенное” — означает, что активность эта распределена по ткани равномерно. Но к этому термину можно применить и слово “малое”, так как любое представление в мозге всегда будет иметь меньшую размерность чем внешний мир. На самом деле разреженность и рапределённость является лишь результатом работы нейро-детекторного подхода, мы на практике увидим как это происходит. Многие могут связать понятие SDR с работами Джеффа Хокинса (Jeff Hawkins), так как он активно писал о SDR и применял его в своей модели Hierarchical Temporal Memory или HTM, но SDR это общий экспериментально наблюдаемое явление свойственное для нервных систем всех млекопитающих (и насекомых) от мышей до человека. Автор не разделяет взглядов Джеффа Хокинса относительно HTM, по причине невозможности существования HTM-нейрона (так как описывает его Джефф) который не вписывается в общепринятую нейронную парадигму — опять же по мнению автора. Попробуем создать искусственную нейронную сеть основанную на нейроно-детекторном подходе, мы будем руководствоваться и вдохновляться знаниями о биологическом мозге и принципах его работы.
Схема и организация сети
Нет инструмента который бы одинаково хорошо работал с обычными и разреженными данными одновременно, поэтому механизм работы нейронов-детекторов связанных с внешними данными и данными возникающими внутри сети будет различаться. Первый слой нашей модели будет получать обычный вход, в данном случае 784 мерный вектор представляющий собой цифру из набора MNIST, и на выходе мы получим разреженность (SDR), а все последующие слои будут получать SDR и выдавать SDR. По существу, главная задача первого слоя преобразовать данные в разреженное представление, в обучении этого слоя нет необходимости. Перебрав множество вариантов к принципам построения этого слоя я пришёл к самому простому и оптимальному варианту, применению нескольких ядер свёртки выбранных вручную. Шестнадцать ядер размером 5х5. Выбор ядер определяется распространенностью паттернов в данных которые мы будем обрабатывать. К примеру, для цифр из MNIST характерны пустые, незаполненные пространства, то есть почти в каждом примере можно найти ни одну область 5х5 где все пиксели будут равны 0, такое ядро разумно внести в наш набор. Также цифры выполнены линиями, разной толщины и ориентации, что определяет ещё некоторые варианты ядер — линии разной направленности. Здесь важно, чтобы набор оказался максимально разнообразным. Как мы знаем для первичной зрительной коры свойственны нейроны-детекторы линий различной ориентации, каждая колонка фактически настроена на свой раздражитель. Хьюбел Дэвид и Торстен Визел в своей работе по картированию первичной зрительной коры ввели термин — гиперколонка или модуль, что представляет собой совокупность всех колонок которые имеют общее рецептивное поле, к примеру, небольшую область на экране где проецируются светящиеся линии различной ориентации. То есть в составе модуля (название термина модуль, для меня более приемлем, чем гиперколонка, так как нет созвучия с темином колонка, поэтому здесь и далее буду применять это название) присутствуют все представительства ориентаций линий для обоих глаз и это составляет около 1000 колонок. В нашем варианте будет всего 16-ть нейронов-детекторов в модуле (да, наш нейрон-детектор эквивалентен одной колонке в коре), каждый будет соответствовать своему ядру. Каждый модуль будет отвечать за свой фрагмент картинки 5х5, причём, как и в коре рецептивные поля колонок обычно пересекаются, поэтому мы будем разбивать общую картинку на фрагменты 5х5 шагом 1. Модульный принцип организации фундаментален для нашей сети, как для первого слоя так и для последующих. Главное особенность модульного построения это то, что победитель в модуле всегда один. То есть среди нейронов-детекторов модуля идет конкуренция которая будет определять какой нейрон в модуле будет иметь приоритеты в активации и обучении. Подобно тому как у живых колонок существует латеральное ингибирование (боковое торможение), за счёт которого колонки со слабой активностью полностью подавляется, а за счёт эффекта иррадиации (стремления возбуждения распространится) победившие колонки укрепляются в своей активности. В предыдущих своих работах я описывал опыты с пиксельным шейдером в котором реализованы латеральное ингибирование и иррадиация, которые показывает, что любая изначальная активность преобразуется в небольшие точечные распределенные очаги. Вот и причина распределённости и разреженности. В коре нет явных границ модулей, но при создании математической модели нейронных сетей мы можем её сделать более точной и структурированной, в какой-то степени в этом наше преимущество. Поэтому латеральное ингибирование можно заменить правилом: в модуле может быть активен только один нейрон-детектор. Первоначальную активность каждого нейрона в первом слое оцениваем по манхэттенскому расстоянию, но в конечном итоге, в каждом модуле будем считать активным только один, тот который будет иметь максимальную близость со входным вектором в модуле. Работа модуля может напомнить принципы работы сети Кохонена, наша будущая модель как будто состоит из множества малых сетей Кохонена. Примеры работы первого слоя. Входной вектор 28х28, ядро 5х5 шагом 1, в модуле по 16 нейронов-детекторов, в итоге получаем результат 24х24х16, которую преобразуем в планарный вид 96х96. Этот выход первого слоя представляет собой SDR для любого входного вектора. Планарность или представление данных в двумерном виде в нашем случае очень важна, так как последующие слои будут получать данные именно таком виде, еще это более наглядно и похоже на то как представлены данные в коре мозга. Как уже оговаривали ранее, главная задача первого слоя это представление внешних раздражителей в виде SDR. Так как количество нейронов в модуле 16, то соотношение единиц и нулей в полученном SDR всегда будет 1 к 15-ти, для любого входного вектора. Наш первый слой не обучается, только преобразует данные. Так как слой производит обычное преобразование данных, то возможно получить и обратное преобразование, которое показывает, что трансформация данных происходит с некоторой потерей качества, но это необходимая жертва, так как полученные данные будут абсолютно нормализованы, полная сумма полученного вектора будет всегда одинакова, независимо от того, что подано на вход сети. В биологии подобные преобразования происходят уже на уровне сетчатки глаза, благодаря on-, off-клеткам, независимо от того, что проецируется на сетчатку глаза общая активность нерва идущего от глаза будет постоянна. Нейроны последующих слоев будут получать на вход разреженные вектора. Если нейроны первого слоя, можно сказать, выделяли признаки из входных данных (палочки, точки, пустоты), то нейроны последующих слоев будут генерализировать то есть обобщать выделенные признаки.
Неконтролируемое обучение снизу-вверх
Самообучение это главная подсказка того где искать наш Священный грааль. Можно сказать, что обычно обучение у животных и человека в своем большинстве происходит на данных которые не являются размеченными, зачастую эти данные не полные и зашумлены. А метки появляются в процессе обучения лишь иногда, в форме сопоставления модальностей, то есть обучение по разметке, контролируемое обучение является лишь вспомогательным, так как в основе лежит самообучение. Если говорить о задаче распознавания образов, то по существу нам нужен алгоритм который позволит формировать разнообразный набор нейронов-детекторов, которые реагировали бы на явно выраженные представителей своих классов. Ранее в своих изысканиях я использовал алгоритм сетей Кохонена и его вариации, но он плохо работает с разреженным представлением, что не позволило мне создать многослойный вариант сети. Да и нейрон этой сети свою активность определяет по манхэттенской близости, но я склонялся к более простой версии нейрона, как простого сумматора. И решать задачу классификации на простых сумматорах оказалась очень просто. Меня заинтересовала статья, которая рассказывала о успешной кластеризации MNIST с помощью спайковых сетей, решение было для меня очень большим, громоздиким и сложным. Поэтому я попытался реализовать механику этой кластеризации без чего-либо лишнего, результат уместился буквально в несколько строк кода (ссылка на Google colab). В примере выше веса нейронов, которых в слое 256 (16×16). За такт сети во всём слое может обучаться только один, самый активный нейрон. Обучение происходит по очень простой формуле:
map[:, winner] += rate * (inp - 0.5)
к весам победителя прибавляем произведение коэффициента ставки обучения (rate=0.2) и разности вход минус 0.5. Почему именно 0.5? — Это банально среднее значение от диапазона входа, он является вещественным числом от 0 до 1. Назовём это число — целевая интенсивность. Целевая интенсивность позволяет провести границу между слабым и сильным входом. По сути эта формула приводит к ослаблению слабых входов и усилению сильных. И чем слабее вход тем мы сильнее уменьшаем связанный с ним вес и наоборот. Конечно, в связи с этим для этого алгоритма подойдут не все данные, там где число в векторе не означает только интенсивность, а несёт более сложную информацию вероятнее всего лучше применять сети Кохонена, но для MNIST это работает достаточно хорошо. Также этот алгоритм имеет явное преимущество, здесь практически отсутствует проблема “суперпобедителя” или лидера. Суть её в том, что выделяется один нейрон который побеждает чаще всего и часто забирает себе всё обучение. Благодаря обучению соседеи в сетях Кохонена эта проблема не проявляется явно. Дело в том, что при использовании вышеописанного алгоритма если стартовая сумма весов достаточно большая, то чем больше обучается нейрон тем меньше уровень его активации на входной вектор, по сравнению с менее обученными нейронами, тем самым у менее обученных нейронов будет больше шансов на победу. Это имеет ключевое значение в начале обучения, когда нейрон только приобретает свою специализацию. Поэтому логичнее всего было сделать значение всех весов при инициализации сети равными единице. При рождении мозг имеет максимальное число нейронов и первые дни и недели разворачиваются максимальное число синаптических связей. Далее в процессе роста и обучения происходит общая деградация и утрата синаптических связей, а также потеря нервных клеток. Этот процесс называется прунинг и особо большие его масштабы для человеческого мозга проходят к первым трем годам после рождения. Прунинг позволяет более точно специализироваться нейронам, и это можно сравнить с тем, что происходит в нашем алгоритме кластеризации, изначально все веса равны 1, то в процессе обучения лишнее сводится к нулю. Но у этого алгоритма есть недостаток, это стремление к наименьшей сумме весов, при все большем обучении уровень активации будет снижаться, также будет снижаться и сумма весов, и для победы нейроны будут специализироваться на примеры с всё меньшей суммой. Для устранения этой проблемы напрашивается решение о нормализации входного вектора, причем приведение суммы входного вектора к константе. И лучшее для этого решение это SDR. Но, на самом деле простое сочетание этого алгоритма и SDR не решает проблемы снижения общей суммы весов, хотя разнообразие классов будет сохранятся. Необходимо привнести в алгоритм еще большей стабильности. Общая идея работы биологического нейрона заключается в том, что он укрепляет в регулярно повторяющиеся связи, а редко используемые связи деградируют и теряются, формируются некие устойчивые пути распространения нервных сигналов. Для реализации этого необходимо вести некую статистику для каждого синапса, насколько часто и эффективно он используется. Поэтому помимо карты весов у нас будет карта “температурного следа” или trace, значение этой карты будут в диапазоне от 0 до 1. Каждый раз когда оба нейрона будут активны соединяющий их синапс будет прибавлять к trace +0,3, но при других тактах сети значение trace будет постепенно убывать на -0,001. Таким образом синапсы которые будут регулярно эффективно использоваться будут иметь высокий trace близкий к 1, напротив для синапсов которые практически не используется trace будет равным нулю или близким к нулю значению. Этот показатель будет оказывать прямое действие на значение веса синапса, так как часто используемые синапсы следует усиливать. Окончательная формула для полученного алгоритма имеет следующий вид:
map[winner,:] = (1 - rate)*map[winner,:] + rate*(inp - 0.5) + trace[winner,:]*rate
Помимо известной формулы, здесь при победе веса нейрона увеличиваются на произведение trace и rate тем самым часто используемый синапс усиливается, в противовес этому происходит регулярная деградация синапсов, их веса уменьшаются по модулю (1 — rate)*map[winner,:]. Так как постоянный рост в биологических клетках невозможен, всегда есть некий ограниченный ресурс, поэтому существует гетеросинаптическая конкуренция. Также веса ограничены в диапазоне от -1 до 1, где -1 — это максимально сильный ингибирующий синапс, а 1 — это максимально сильный побудительный синапс. Описанный алгоритм достаточно прост и позволяет производить самообучение сети даже организованной во множество иерархических слоёв. Далее давайте рассмотрим конкретную конфигурацию многослойной сети для примера. Для рассматриваемого варианта сети модули следующего слоя также будет содержать по 16 нейронов-детекторов, у которых будет иметься общее рецептивное поле. Рецептивное поле нейрона будет иметь размер 20х20, что составляет 25 (5х5) модулей предыдущего слоя. Рецептивные поля модулей будут пересекаться с шагом в 4. Итого следующий слой будет содержать 400 (20х20) модулей по 16 нейронов, всего 6 400 (80х80) нейронов. Напомню первый слой составляет 96х96 (9 216) нейронов. По похожей схеме добавим еще два слоя, в первом из них размер модуля будет 16 (4х4) нейронов. Третий слой размер рецептивного поля 20х20, шаг 4, итого 64х64 нейронов. Четвертый слой — рецептивное поле будет охватывать весь предыдущий слой 64х64, но размер модуля мы сделаем 36, фактически активность этого слоя будет охарактеризовано только одним нейроном из 36, чтобы получить четкий выраженный детектор одной цифры. И последний пятый, выходной слой будет содержать только 10 нейронов по количеству распознаваемых классов. Этот слой необходим чтобы сопоставить результат работы предыдущих слоёв и метки цифры. Этот слой будет иметь только один модуль, соответственно возможна активность только одного нейрона из этого слоя. Каждый нейрон выходного слоя будет иметь одинаковое рецептивное поле размером 6х6 (=36). В итоге получается схема: 28х28 (рецепторы) → 96х96 (первый слой, необучаемый, просто преобразует входной сигнал в SDR) → 80х80 (второй слой) → 64х64 (третий слой) → 6х6 (четвертый слой) → 10 (выходной слой). Многослойность данной сети выбрана для демонстрации всех аспектов её работы, в частности “глубокого обучения”, для задачи MNIST возможно использовать и более простую конфигурацию. Выходной слой имеет всего 10 нейронов по количеству распознаваемых классов, все нейроны выходного слоя включены в один модуль. Это значит, что все нейроны выходного слоя имеют общее рецептивное поле равное размеру предыдущего слоя (в данном примере 6х6), также может быть активным только один нейрон выходного слоя. Предпоследний слой состоит из одного модуля, в нем будет формироваться при самообучении некое представление, каждый из 36 нейронов будет реагировать на свой выбранный тип входного сигнала, обучение последнего же слоя происходит на сопоставлении полученного представления с меткой класса представляемого сети примера. Если метка совпала то увеличиваем вес синапса на rate (0.1), а для всех остальных синапсов которые связаны с другими классами вес снижается на тоже значение только деленное на общее количество классов, то есть на число меньшее в десять раз. Итогом, самообучение на 5 000 примерах предъявленных сети по одному разу, качество составляет примерно 77%. То есть мы явно видим, что самообучение работает и происходит выделение классов цифр даже без привязки к метки. Но мы можем улучшить этот результат распространив влияние метки класса глубже в слоях.
Контролируемое обучение или обратное распространение влияния
Алгоритм обратного распространения ошибки (backpropagation, бэкпроп) для коннекционных нейронных сетей стал невероятным мощным двигателем машинного обучения, благодаря нему искусственные нейронные сети сдали давать потрясающие результаты. Но этот алгоритм не сочетается с тем, что мы знаем о биологической нервной системе. И вопрос не в распространении сигналов назад по сети, а в том, что нужно передавать достаточно много информации, нужно передавать значение ошибки, и пока не известны в биологии механизмы, механики или органеллы которые даже бы производили бы оценку этой самой ошибки. Существует множество статей которые предлагают якобы близкие к биологии варианты бэкпропа, но все это, если оценивать со стороны биологии истории про сову и глобус. С одной стороны между различными областями коры участвующей в иерархической обработки информации, как у аналогов слоёв в искусственных нейронных сетях, есть обратные связи и их иногда насчитывают в несколько раз больше чем прямых связей. Происходит постоянная циркуляция возбуждения между участками коры — реверберация. Но каких-то сложных вычислений при этом не производится. Вычисления производятся на органелле — мембрана и алгоритм этих вычислений определён моделью Ходжкина — Хаксли, всё, в этой системе знаний нет места бэкпропу и вычислений ошибок. И всё таки нейрон находящийся на низком уровне иерархии имеющий ограниченное рецептивное поле какой бы у него не был хороший алгоритм самообучения эффективно обучаться не может без высокоуровнего дирижера, без подсказок исходящей от общей поставленной задачи или цели. Модульная организация сети и SDR позволяет нам применить алгоритм обратного распространения влияния или backpreference. Нейроны в модуле конкурируют между собой, так как в модуле может быть только один победитель, какой именно нейрон победит определяют восходящие связи и их веса, но возможно благодаря нисходящим связям дать некоторым нейронам в этой борьбе преимущество. Возможно взять любой нейрон последнего слоя и оценить активность каких нейронов предыдущего слоя вероятнее всего приведут этот нейрон к победе, и далее так можно спускаться на более нижние уровни. Зная метку класса мы можем выбрать нейроны последнего слоя которые наиболее релевантны этой метке, далее двигаясь вниз от слоя к слою обозначать те нейроны которые в конце концов дадут преимущество нужным нейронам последнего слоя, затем этим нейронам дадим преимущество в победе добавив некоторое значение к итоговой сумме их активации. Получается мы лишь немного вмешиваемся в процесс самообучения, направляя его в более подходящее русло. Мы можем регулировать то на сколько контролируемое обучение будет оказывать влияние на неконтролируемое. Разумно если контролируемое обучение будет сильнее действовать на последних слоях, а самообучение будет действовать больше на первых слоях которые ближе ко входу к рецепторам. В нашем примере есть три обучаемых слоя, на последний, третий из них контролируемое обучение действует с коэффициентом 1, что говорит 100% выиграет тот нейрон который получит преференции. Для второго слоя коэффициент составляет 0.5, и на первом только 0.1, здесь большее преимущество у самообучения. Это очень гибкое сочетания контролируемого и неконтролируемого обучения, можно в любой момент полностью отключить контроль и дать самообучению управлять, а когда появится необходимые метки добавить в обучение контроля. Это очень похоже на то как работает и учится биологический мозг. В начале обучения когда выходной слой еще не определил корреляцию нейронов последнего слоя и меток класса, контролируемого обучения вообще не происходит, только за счет самообучения формируются слабые соотношения, которые затем подхватываются контролируемым самообучением и укрепляются. Результат с применением контролируемого обучения на 5 000 примерах предъявленных сети по одному разу, качество составляет примерно 93%. Конечно алгоритм по метрикам качества уступает коннекционным нейронным сетям с бэкпропом, но это очень достойный результат учитывая, что в алгоритме нет никаких методов сходимости и вычисления ошибки. Увеличение размерности сети, а значить её потенциальной ёмкости при тех же параметрах тренировки может немного улучшить результат по качеству.
Интерпретируемость искусственной нейронной сети на базе нейро-детекорного подхода
Вопрос интерпретируемости сети очень важен, не достаточно взять модель обучить её на большом количестве данных и полностью довериться ей, особенно если речь идет о жизни и здоровье людей. Необходимо хорошо понимать почему эта модель принимает те или иные решения, должна быть возможность предсказать её действия на любой внешний стимул. В это нейронным сетям основанным на нейро-детекторном подходе не будет равных. Мы уже затрагивали тему интерпретируемости говоря о малом репрезентативном представлении, в примере где латентное пространство имеет всего два измерения как в случае двух нейронов между энкодером и декодером, в этом примере мы легко можем интерпретировать результата обучения, но только одного самого узкого слоя. Но например, в задачах распознавания лиц, латентное пространство достаточно большое и имеет, например, 18 параметров, представить в наглядном и читабельном виде 18-мерное измерение и сопоставить с образами лиц будет достаточно сложно, не говоря уже о других слоях сети. Для сетей на базе нейро-детекторного подхода легко интерпретировать результаты, возможно провести обратное преобразования и получить значения активности рецептивного поля которая вероятнее всего приведет к активности конкретного нейрона, причем это можно сделать для любого нейрона любого слоя. Фактически алгоритм обратного распространения влияния и производит обратные преобразования, мы просто применим его для интерпретации результатов обучения. Возможность интерпретировать результаты обучения сети нужны не только для большего доверия сети, но и для возможности исключать недопустимые действия в её работе, корректируя работу сети, прямо изменяя её веса, блокируя работу конкретных нейронов, а не пересматривать содержание датасета или применять дополнительные алгоритмы.
Локальный минимум коннекционных сетей с бэкпропом
Искусственные нейронные сети и в частности алгоритм обратного распространения ошибки одно из величайших открытий Человека, который еще во многом поспособствует развитию прогресса. Этот совершенный математический инструмент может преобразовать данные в функцию, но в вопросе создания общего искусственного интеллекта или интеллекта человеческого уровня развитие сетей как математического инструмента не приведёт к желаемому результату. Не имеет смысла стремиться превзойти бэкпроп в метриках качества. Изучение нейробиологии, нейропсихологии и физиологии нервной системы дает представление о принципах на которых основаны когнитивные функции, но эти принципы никак не согласуются с механизмами работы классических искусственных сетей. Поэтому я долго искал “Священный Грааль” алгоритм нейронной сети соответствующий парадигме работы сети биологического мозга, и следующий этап исследований будет направлен на применение знаний управления сетью на основе нейро-детекторного подхода с помощью эмоциональных механизмов и воплощению механизмов обучения с подкреплением на базе этой сети. Если представить задачу создания искусственного интеллекта общего назначения в виде пространства решений, то с коннекционными сетями мы находимся в неком локальном минимуме, нельзя не отметить величайшие достижения полученные моделями основанные на данном алгоритме. Но есть альтернатива, которая только зарождается, которая пока не имеет ярких и значимых результатов, и в перспективе, кто значет, с развитием даст возможность решить задачу создания искусственного интеллекта. Исходник на Google colab