Машинное обучение и Искусственный Интеллект для
анализа больших данных.
Тезисы. (Machine Learning & Artificial
intelligence for Big data analysis.
Introduction)
Виталий Мильке
Lectured and PhD researcher in Computer Sience &
Machine Learning Anglia Ruskin University Cambridge
UK
Конкурс «Лидеры Росии» 2018, Победитель
Федеральный проект
«Развитие технологий в
области Искусственного
интеллекта»
Дорожная карта
«Искусственный
интеллект»
- Поддержка научных исследований (R&D - Research and Development)
- Развитие программного обеспечения для AI (Frameworks)
- Повышение доступности и качества данных (в первую очередь
государственных)
- Создание процессоров для AI и обеспечение доступности аппаратного
обеспечения
- Подготовка кадров
- Увеличение количества организаций-разработчиков AI-технологий и
поддержка экспорта
- Популяризация AI решений среди граждан (Создание внутреннего рынка)
- Регуляторика
Стратегии других
государств в области AI
* (Dutton, 2018)
Искусственный
Интеллект (AI)
Слабый (специализированный)
(Weak, Narrow, Applied)
Сильный (Общий)
(Artificial General Intelligence)
Gartner's Hype Cycle
Экономическое влияние AI (прогноз)
В среднем удвоение
ежегодных темпов
роста валовой
добавленной
стоимости ~ ВВП к
2035г.
* (Purdy, 2019)
Глубокое
обучение
(Deep Learning)
Математическая модель нейросетей
была сформулирована в 1943г.
Модель нейросети
Скрытые слои
Deep
Learning Framework
Обучающий
алгоритм
Глубокое
обучение
(Deep Learning)
Математическая модель нейросетей
была сформулирована в 1943г.
Модель нейросети
Скрытые слои
Deep
Learning Framework
Обучающий
алгоритм
Data
DATA
Сигмоида ?
Data
Экспонента ?
Intelligent Data (~5%)
TIME
GPU / TPU
NVIDIA TESLA V100
Google Tensor Processing Unit
(TPU
)
NVIDIA QUADRO RTX 8000
Intel Nervana Neural
Network Processor
AMD Vega 7nm (GPU)
Data
Сигмоида ?
DATA
?
Data
Экспонента ?
Intelligent Data (~5%)
TIME
Аксиома:
Закрытие или ограничение доступа к
данным приводит к замедлению
развития (снижение темпов развития)
Искусственного интеллекта в отдельно
взятой стране
Data
Alibaba Cloud uses its proprietary AI
platform which includes
- image and
- -voice recognition and
- clinical diagnosis support
so medical institutions large and small can
have access to today’s best technological
advancements in the medical industry.
It supports
- visual application management,
- secure data docking and
- data integration and
- allows healthcare organisations as well as
patients to access medical history and
diagnosis quickly and easily.
Data
Задачи:
- Поделить все данные по типам (отдельно радиологию,
результаты анализов, историю болезни и т.д.)
- Централизовать хранение данных в размере всей страны и
избавить “районные поликлиники” заниматься поиском лучших
решений в IT & AI
Результат: Создана монополия которая обязуется
- резко снизить расходы на хранение данных,
- обеспечить их защиту и
- предоставить всему здравоохранению доступ к самым
современным методам Machine Learning and Artificial
Intelligence
Data
Результат
Переменная
Математическая
Статистика
Data
Машинное обучение
(Machine Learning)
Recommender
System
N - мерное
пространство
Классические методы Machine
Learning и Многомерный
статистический анализ
Математическая
Статистика
Data
Нейронные сети
(Neural Networks)
- Законодательно заставить все научные
учреждения валидировать результаты научных
статей с новыми подходами в Машинном
обучение и прикладном AI (алгоритмы, новые
топологии нейронных сетей и т.д.) на реальных
данных, размещенных в общероссийской
платформе государственных данных (т.е.
проверить и подтвердить гипотезу).
Recommender
System
Простые и предобученные
нейросети
Классические методы Machine
Learning и Многомерный
статистический анализ
Математическая
Статистика
Data
- Все институты развития должны обеспечить
доступ к этим данным для стартапов.
Экспертные системы Versus Нейросети
Нейронные сети
(Neural Networks)
Recommender
System
Простые и предобученные
нейросети
Классические методы Machine
Learning и Многомерный
статистический анализ
Математическая
Статистика
Data
Предобученные нейронные
сети
(Pre-trained Neural Networks)
Pre-trained Convolutional
Neural Networks
Перенос обучения и
тонкая настройка
(Transfer Learning &
Fine-tuning)
VGG-16
Нейронные сети
(Neural Networks)
Большие нейросети
Recommender
System
Простые и предобученные
нейросети
Классические методы Machine
Learning и Многомерный
статистический анализ
Математическая
Статистика
Data
Аналитические
(точные)
методы
𝑦 ~ 𝑥𝑛
Cовременные
численные методы
обучения нейросетей
y ~ x - ЦЕЛЬ
Backpropagation
Аксон
нейрона
В человеческом мозге
НЕТ Backpropagation !
Нейронные сети
(Neural Networks)
Сильный AI
(Artificial General
Intelligence)
Повысить доступность данных
Большие нейросети
Recommender
System
Простые и предобученные
нейросети
Классические методы Machine
Learning и Многомерный
статистический анализ
Математическая
Статистика
Data
- Общедоступные и постоянно обновляемые
государственные Datasets
- Стандарты обмена, хранения и разметки
гос.данных, включая требования к качеству
данных
- Единые условия доступа к гос.данным
- Стандарты разметки данных в
чувствительных domains (Медицина,
Беспилотные аппараты и авто)
- Платформы данных (Alibaba)
Демократизация Искусственного интеллекта
manual models
?
Внедрение технологий прикладного
Искусственного интеллекта
(Applied Artificial Intelligence Implementation
Business
Understanding
(Анализ Бизнеспроцессов)
Data
Understanding
and Collection
(Сбор Данных)
Data Project
Manager Data
analyst
Data
Preparation
(Подготовка
Данных)
Data
Engineer
Modeling and
Prototyping
(Моделирование и
Прототипирование)
Data Scientist
Evaluation
(Оценка
результатов)
Implementation
(Внедрение)
Data Project
Manager Data
analyst
Кадры
- Тотальное обучение новым технологиям
- Удержание специалистов
- Программа стимулирования возврата
русскоязычных специалистов (аналог китайской
программы)
- Привлечение иностранных ученых
- Гранты, стипендии, государственные премии
- Второе высшее бюджетное образование для
взрослых (1..1,5 года)
- Об этике в искусственном интеллекте (https://roscongress.org/blog/vitaliy-milke-ob-etike-v-iskusstvennomintellekte/)
- Искусственный интеллект – паровой двигатель XXI века (https://roscongress.org/materials/vitaliy-milkeiskusstvennyy-intellekt-parovoy-dvigatel-xxi-veka/)
- О предобученных нейронных сетях (Pre-trained Neural Networks) в медицине и генетике
(https://roscongress.org/blog/vitaliy-milke-o-predobuchennykh-neyronnykh-setyakh-pre-trained-neuralnetworks-v-meditsine-i-genetik/)
- О больших данных для обучения машин (https://roscongress.org/blog/vitaliy-milke-o-bolshikh-dannykhdlya-obucheniya-mashin/)
- О непрерывном образовании взрослых в контексте развития технологий искусственного интеллекта в
России (https://roscongress.org/blog/vitaliy-milke-o-nepreryvnom-obrazovanii-vzroslykh-v-konteksterazvitiya-tekhnologiy-iskusstvennogo-i/)
- О центрах обработки данных для искусственного интеллекта (https://roscongress.org/blog/vitaliy-milke-otsentrakh-obrabotki-dannykh-dlya-iskusstvennogo-intellekta-/)
- О развитии технологий искусственного интеллекта в России: нужно поставить задачу и дойти до конца
(https://roscongress.org/materials/vitaliy-milke-o-razvitii-tekhnologiy-iskusstvennogo-intellekta-v-rossiinuzhno-postavit-zadachu-i-do/)
- О технологии E-nose (https://roscongress.org/blog/vitaliy-milke-o-tekhnologii-e-nose-/)
Список литературы (References)
- Keras, 2017. Francois Chollet, Google LLC. [online] Available at: <https://keras.io>
- Blaise Aguera y Arcas, 2016. How computers are learning to be creative.
<https://www.ted.com/talks/blaise_aguera_y_arcas_how_computers_are_learning_to_be_creative>
- NITRD, 2019, The Networking and Information Technology Research and Development Programme. [online] Available at: <
https://www.nitrd.gov/news/National-AI-RD-Strategy-2019.aspx >
- SingularityNET, 2017. A decentralized, open market and inter-network for AIs.
<https://public.singularitynet.io/whitepaper.pdf>
- Dutton, T., 2018. Artificial Intelligence Strategies. . [Online] Available at: < https://medium.com/politics-ai/an-overview-ofnational-ai-strategies-2a70ec6edfd>
University of Cambridge , 2018. The future of intelligence: Cambridge University launches new centre to study AI and the
future of human. [online] Available at: <https://www.cam.ac.uk/research/news/the-future-of-intelligence-cambridgeuniversity-launches-new-centre-to-study-ai-and-the-future-of>
- Jaderberg, M. and others, 2017. Population Based Training of Neural Networks. [online] Available at:
<https://arxiv.org/pdf/1711.09846.pdf>
- DataGrid, 2019. Humans created by AI. [online] Available at: <https://datagrid.co.jp/en/>
Список литературы (References)
- Resources.data.gov, 2020. A repository of Federal Enterprise Data Resources. <https://resources.data.gov/>
- Resources.data.gov, 2013. PROJECT OPEN DATA. Available at: < https://project-open-data.cio.gov/ >
- Alibaba, 2020. Medical Brain. Available at: <https://www.alibabacloud.com/solutions/intelligence-brain/medical>
- Alibaba, 2020. Architecture Center. Available at:
<https://www.alibabacloud.com/architecture/index?spm=a3c0i.272861.7553912210.dbanneraenarchitecture.7f2d24af9y2F19>
- Shoham, Y., Perrault, R., Brynjolfsson, E., Clark, J. and LeGassick, C., 2017. Artificial Intelligence Index—2017 Annual Report.
Available at: https://aiindex.org/2017-report.pdf
- Huawei, 2019. Huawei launches Ascend 910. [online] Available at: <https://www.huawei.com/en/pressevents/news/2019/8/huawei-ascend-910-most-powerful-ai-processor>
M., Daugherty, P.,2019. Why Artificial Intelligence is the Future of Growth. Available at:
<https://www.accenture.com/t20170524T055435__w__/ca-en/_acnmedia/PDF-52/Accenture-Why-AI-is-the-Future-ofGrowth.pdf>