Uploaded by Yakubov Anvar

SAP Data Intelligence

advertisement
Управление данными с помощью SAP Data
Intelligence
PUBLIC
Управление данными – 5 основных задач по мнению SAP
Использование и монетизация данных
Отчетность
SAC
AutoML
Machine Learning
SAP DATA INTELLIGENCE
Управление метаданными
Корпоративная
архитектура
SAP POWER DESIGNER
Каталог метаданных
Классификация
Бизнес-
SAPданных
DATA INTELLIGENCE
глоссарий
Data Lineage
Анализ и улучшение качества данных
SAP MDG
На основе правил
С помощью ML
SAP DATA INTELLIGENCE
Интеграция и обработка данных
ETLDS
SAP
Репликация
HANA
SDI
Анализ
потоковых
данных
Streaming
Analytics
Data INTELLIGENCE
Pipelines
SAP DATA
Защита конфиденциальной информации
Маскирование
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
Анонимизация
SAP DATA INTELLIGENCE Авторизация на доступ к данным
2
Управление данными – факторы успеха
§
§
Управление данными должно быть ориентировано
на получение ценности для бизнеса – это первый
приоритет
Это позволит:
§ Вовлечь в процесс руководство компании и бизнес в
процесс
§ Показать связь между связь между инвестициями в
управление данными и реальными результатами
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
3
SAP Data Intelligence
Распределенные
системы
Решения SAP
SAP
NetWeaver
+ DMIS Addon
ABAP
Integration
SAP Data Intelligence
Streaming (e.g. IoT)
Cloud Storages
SAP BW/4 HANA
SAP BW
BW
Integration
Интеллектуальные Сценарии
Разработка ML | Продуктивизация | Управление
Standard
Connectors
(open & native
protocols)
Hadoop / HDFS
REST APIs
SAP C/4HANA
Cloud Data
Integration*
…
BW Process
Chains
Data Services
Jobs
HANA
Flowgraphs
SAP Analytics Cloud
Workflows
Управление данными
Databases
Поиск | Каталог метаданных | Глоссарий | Качество
Public Clouds
Интеграция и обработка данных
Сбор данных | Обработка | Прогнозирование
SAC Push API
Оркестрирование данных
(on-premise, cloud, multi cloud)
3rd Party
Connectors
SAP HANA
Integration
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
Интеграция | Планирование | Мониторинг
3rd Party Applications
SAP API
Business Hub
SAP Cloud
Platform
Connectors
SCI for process
integration
SAP Open
Connectors
5
Исследование данных
Поиск, просмотр и профилирование
•
I. ИССЛЕДОВАНИЕ
Исследование данных систем,
подключенных SAP Data Intelligence
•
Профилирование и просмотр данных
•
Данные профилирования
предоставляют статистическую
информацию для того, чтобы больше
узнать о данных
•
Предварительный просмотр
предлагает общее представление
данных
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
6
Каталог Метаданных
II. ОПРЕДЕЛЕНИЕ
§ Публикация метаданных в Каталог
– Metadata Crawler: Автоматическое индексирование и
публикация метаданных в каталог
– Индексация и публикация вручную
SAP Data Intelligence
Metadata Explorer
Discovery &
Profiling
Search
Lineage
§ Гибкий поиск данных по названиям объектов, полей и
тегам
Modeling
Automation/
Suggestions
Business
Rules
Metadata
Catalog
§ Data Lineage обеспечивает полное понимание
происхождения и использования данных
Metadata Crawler
Manual Definition
Connected Sources
SAP Data Hub Sources
(SAP HANA, SAP BW, S3, HDFS,
OData, Oracle, …)
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
Other Repositories
(SAP Information Steward,
Atlas by SAP, Hive)
7
Каталог Метаданных
Иерархическое тегирование
II. ОПРЕДЕЛЕНИЕ
Иерархическое тегирование
Система
иерархического
тегирования
организовывать ведение тегов и управлять ими.
помогает
Сценарий применения
•
Управление большим Каталогом Метаданных можно
упростить с помощью иерархий типов контента
Возможности
•
Присвоение тегов объектам данных или отдельным
колонкам
•
Редактирование и удаление тегов, которые уже не
релевантны
•
Просмотр тегов в Каталоге Метаданных, Lineage, и в Fact
Sheet
•
Фильтрация и поиск данных по тегам
•
Автоматическая идентификация тегов по типам
контента. Для этого необходимо опубликовать объект
данных в Каталог Метаданных и профилировать данные
объекта.
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
8
Каталог Метаданных
Сотрудничество, рейтинги и комментарии
II. ОПРЕДЕЛЕНИЕ
Рейтинги и комментарии
Рейтинги и комментарии позволяют бизнеспользователям совместно работать над одними и
теми же доменами данных.
Сценарии применения
Организация совместной работы над данными и
коммуникации между различными персонами с
помощью оценок и комментариев к объектам данных
•
Повторное использование знаний о данных для
новых пользователей
•
Возможности
Использование профилирования данных для
публикации информации о рейтинге в Metadata
Explorer
•
Простой способ добавить комментарии, чтобы
обозначить бизнес-контекст
•
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
9
Управление данными
Бизнес-Глоссарий
II. ОПРЕДЕЛЕНИЕ
Бизнес-глоссарий
• Описывать различные бизнес-термины на языке бизнеса
• Связывать бизнес-термины с объектами Каталога Метаданных,
т.е. с объектами данных, которые существуют в подключённых
системах
• Создавать категории для группировки бизнес-терминов,
принадлежащих одной предметной области или бизнеспроцессу
• Создавать новые шаблоны для бизнес-терминов, которые
позволят присваивать бизнес-терминам дополнительные
атрибуты
• Гибкий поиск по категориям только или по бизнес-термину
только, или поиск по комбинации категории и бизнес-термина
Сценарий применения
•
Центральный и общий репозиторий бизнес-терминов и
определений,
чтобы
способствовать
общему,
последовательному пониманию бизнес-терминов в вашей
организации.
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
10
Анализ качества данных
Правила проверки и функции мониторинга трендов по качества данных
II. ОПРЕДЕЛЕНИЕ
Правила проверки для мониторинга качества данных
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
•
Определение бизнес-правил и мониторинг KPIs по
по качеству данных с помощью дашбордов
•
Повторное использование правил, связь правил с
данными из различных источников
•
Параметризация для динамического анализа
качества данных
Ÿ
Логические операции AND/OR для объединения
условий в бизнес-правилах
Ÿ
Data pipeline операторы для валидации данных и в
том числе потоковых IoT данных
11
Мониторинг качества данных
Дашборд для визуализации результатов проверки качества данных
IV. ОЦЕНКА. И
МОНИТОРИНГ
A custom dashboard shows the data quality information on scorecards
that you’re interested in
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
12
Каталог Метаданных
Metadata Lineage
IV. ОЦЕНКА. И
МОНИТОРИНГ
Профилирование и просмотр
Просмотр источников данных, трансформации данных в
графическом виде от целевого объекта
•
•
Подключение lineage в исследовании данных
Возможности
SAP Business Warehouse: InfoProvider and query
SAP HANA: column table, row table, SQL views, and virtual table
SAP Vora: streaming table, datasource table, and views
Data Pipelines operators
o
Storage operators
o
HANA & VORA operators
o
Flowagent operators
o
SQL statements in HANA/VORA operators
o
New File operators
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
13
Мониторинг задач и активностей
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
IV. ОЦЕНКА. И
МОНИТОРИНГ
14
Self-Service Подготовка Данных
Self-service подготовка данных
Self-service и data-driven подготовка данных для бизнес-пользователей
Сценарии применения
•
Обеспечение процесса подготовки данных в режиме Self-service
•
Улучшение качества данных для использования данных в
интеллектуальных стенаниях
•
Создание новых наборов данных на основе Create new data sets
based for scenario and project requirements
Возможности
delete
combine
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
new or adjusted
data set
•
Доступ к объектам данных для подготовки на основе примеров
данных
•
Трансформация, гармонизация, уточнение и обогащение в режиме
self-service
Ÿ
Просмотр, презентация и отчет по результатам немедленно
Ÿ
Загрузка файлов непосредственно в функциональности подготовки
данных и сохранение в поддерживаемый сторадж
Ÿ
Добавление новых расчетных колонокto values in other columns in the
preparation
16
Каталог Метаданных
Загрузка файлов в Metadata Explorer и Data Preparation
Загрузка файлов
•
Позволяет бизнес-пользователям загружать файлы и
управлять папками в поддерживаемых типах систем:
Amazon S3, Google Cloud Storage (GCS), Hadoop
Distributed File System (HDFS), Microsoft Azure Data Lake
(ADL) and Microsoft Windows Azure Storage Blob (WASB)
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
17
SAP Data Intelligence – Каталог Метаданных
Distributed & External
Data Systems
Решения SAP
SAP
NetWeaver
+ DMIS Addon
SAP BW/4 HANA
SAP BW
ABAP
Integration
SAP Data Intelligence
BW
Integration
…
BW Process
Chains
Data Services
Jobs
HANA
Flowgraphs
SAP Analytics Cloud
(on-premise, cloud, multi cloud)
Workflows
SAC Push API
q
Metadata Catalog
Data
Hub
2.7 and DI 1910
File (CSV,
ORC,
PARQUET)
q
Table, View, CDS View, ODP Extractor
q
InfoProvider, Query, Datastore
q
Virtual Table, Calculation View, Row and
Column Table
SAP HANA
Integration
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
Cloud Storages
Standard
Connectors
SAP C/4HANA
Cloud Data
Integration*
Streaming (e.g. IoT)
(open & native
protocols)
Hadoop / HDFS
REST APIs
Databases
Public Clouds
3rd Party
Connectors
3rd Party Applications
SAP API
Business Hub
SAP Cloud
Platform
Connectors
SCI for process
integration
SAP Open
Connectors
*This is the current state of planning and may be changed by SAP at any time without notice.
18
Позиционирование инструментов SAP
для управления данными
SAP Information Steward
BI
Systems
Databases
Metadata Integrators
Metadata Integrators bundled with Information
Steward
SAP Software: BI Platform, Data Services, SAP BW, SAP
HANA, SAP PowerDesigner, SAP ASE, SAP IQ
NON SAP Software: CWMXML (CWM), RDBMS: MSSQL
Server, DB2, Teradata and JDBC Sources
Other Metadata Integrators available*
ETL
Modeling
Tools
SAP Information
Steward
Metadata
Repository
Altova
Borland
CA
COBOL
Embarcadero
EMC
Gentleware
Silverun
Knightbridge (HP)
IBM
Informatica
Microsoft
MicroStrategy
NoMagic
OMG
Oracle
SELECT
SPARX Systems
SUN
Teradata
Tigris
Visible Systems Corp
W3C
Централизован
ный обзор и
каталогизация
метаданных из
различных
источников
Central
Repository
Other metadata integrators available via Meta Integration Technology, Inc. (MITI);
http://www.metaintegration.net/Products/MIMB/SupportedTools.html
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
20
OUTLOOK
Взаимодополняющие решения – SAP Data Intelligence & Information Steward
SAP Information Steward
Инструмент для решения всех задач управления данными.
Непрерывное понимание качества ваших доменов данных
и расчет стоимости некачественных данных и влияния на
бизнес. Понимание влияние качества данных на ваши
бизнес-процессы и оперативную и аналитическую
отчетность.
Stewardship and Governance
Решение для управления метаданными разнородных
данных (структурированных, неструктурированных,
потоковых, облачных и т. д.), создания инновационных
сценариев, интеграция и обработка данных в
распределенным ландшафте с помощью потоков данных
(data pipelines).
Interoperability*
<<Sources…>>
Compliance and
Financial Impact
Files
Applications
Databases
SAP Data Intelligence
Connection
BI Systems
SAP
Information
Steward
Data Discovery
and Stewardship
ETL Tools
Information
Policy Hub
Metadata
Explorer
Data processing and integration style
IoT Data Stream
ML/Predictive
SAP Data Intelligence
Data
Exchange
C ollect
Prepare
Enterprise Data
Approval Workflow
Unstructured Data
Enrich
R efine
Orchestrate
Data Warehouse
Data Lake/
Object Storages
Основной сценарий :
Основной сценарий применения
Централизованное управление данными в компании в Хранилищах Данных
Data Science и машинное обучение, «большие» данные, интернет вещей
−
Формирование каталога метаданных и бизнес-глоссария
−
Формирование каталога метаданных
−
Определение политик управления данными, привязка бизнес-терминов,
технических артефактов каталога метаданных и правил контроля качества данных с
оценкой стоимости некачественных данных для компании
−
Тэгирование артефактов Каталога метаданных для быстрого поиска и понимания
содержимого этих артефактов
−
Определение бизнес-терминов и связь бизнес-терминов и метаданных*
−
Дашборд для мониторинга качества данных
−
Подготовка дата сетов для использования в инициативах по ML
−
Прозрачность формирования показателей и анализ влияния изменений
−
Анализ качества данных с помощью бизнес-правил
−
What-if анализ для инициатив в области управления данными
−
Дашборд для мониторинга качества данных
−
Прозрачность формирования показателей и анализ влияния изменений
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
21
This presentation and SAP’s strategy and possible future developments are subject to change and may be changed by SAP at any time for any reason without notice. This document is provided without a warranty of any kind, either express or implied, including but not limited to the implied warranties of merchantability, fitness for a particular purpose, or noninfringement.
OUTLOOK
Взаимодополняющие решения – SAP Data Intelligence & Information Steward
Пример совместного использования
SAP Data Intelligence
1a
Machine
Sensor
3
Streaming
Machine Learning
C ollect
Social
Application
2
SAP Information
Steward
Metadata
1b
Data
Stores
Scorecard
1a/b
Получение больших
объемов
структурированных,
неструктурированных,
потоковых, облачных и т.
д. данных (Data
Intelligence)
R efine
4
Orchestrate
Visualization
5
Business Term
Rule
Meta Integration
Bridge (3rd Party)
Enrich
Detect Error
Data Exchange
Information Policy
Database
Prepare
Governance
2
Сбор метаданных из
источников, которые
изначально не
поддерживаются в SAP DI
(например, SAP ASE, CWM и
т. д.), включая не-SAP
источники (например,
Informatica), через открытые
стандарты MITI (SAP
Information Steward)
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
3
Применение алгоритмов
машинного обучения для
автоматической
маркировки ваших
данных для понимания
характеристик
метаданных (SAP Data
Intelligence)**
Cloud
Application
GCS | S3 | WASB *
BW | ABAP *
Relational Database
Hadoop
HANA | SQL | Oracle *
HDFS *
4
Сбор метаданных из всех
источников для того,
чтобы понимать, какие
данные есть в
ландшафте, и получать
представление об
отношениях, «таких же
как», «связанных с» и т.
Д. (SAP Data Intelligence)
5
Предоставление
пользователям гибкого
поиска по всем данным в
одном каталоге и
динамического просмотра
происхождение, анализ
влияния, отчеты о
потребителях данных и т.
д. Для всех данных (SAP
Data Intelligence)
* For a complete list of supported sources refer to SAP Data Hub documentation or PAM
22
This presentation and SAP’s strategy and possible future developments are subject to change and may be changed by SAP at any time for any reason without notice. This document is provided without a warranty of any kind, either express or implied, including but not limited to the implied warranties of merchantability, fitness for a particular purpose, or noninfringement.
OUTLOOK
Взаимодополняющие решения – SAP Data Intelligence & Information Steward
Пример совместного использования
SAP Data Intelligence
1a
Machine
Sensor
Social
Application
2b
Streaming
2a
SAP Information
Steward
Data Exchange
Metadata
Rule
Meta Integration
Bridge (3rd Party)
Business Rule
2b
Scorecard
1b
Data
Stores
Scorecard
1a/b
Получение больших
объемов
структурированных,
неструктурированных,
потоковых, облачных и т.
д. данных (Data
Intelligence)
2b
Machine Learning
C ollect
Prepare
Governance
Enrich
Detect Error
R efine
4
Orchestrate
Visualization
5
Business Term
Information Policy
Database
3
Glossary
2a/b
Формирование
согласованного и
утвержденного бизнесглоссарием / термином с
бизнес-правилами и
системами показателей (SAP
Information Steward и SAP
Data Intelligence)
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
3
Применение алгоритмов
машинного обучения для
понимания всех данных и
связывания данных для
корректировки бизнестерминов и бизнесправил (SAP Data
Intelligence)
Cloud
Application
GCS | S3 | WASB *
BW | ABAP *
Relational Database
Hadoop
HANA | SQL | Oracle *
HDFS *
4
Сбор метаданных из всех
источников для того,
чтобы понимать, какие
данные есть в
ландшафте, и получать
представление об
отношениях, «таких же
как», «связанных с» и т.
Д. (SAP Data Intelligence)
5
Анализ данных:
обнаружение ошибок,
пропущенных данных или
несоответствующего
содержимого (отсутствует
идентификатор
оборудования в данных
датчика и т. д.) и
активация потока очистки
(SAP Data Intelligence)
* For a complete list of supported sources refer to SAP Data Hub documentation or PAM
23
This presentation and SAP’s strategy and possible future developments are subject to change and may be changed by SAP at any time for any reason without notice. This document is provided without a warranty of any kind, either express or implied, including but not limited to the implied warranties of merchantability, fitness for a particular purpose, or noninfringement.
Взаимодополняющие решения – SAP Data Intelligence & Data Services
SAP Data Intelligence
SAP Data Services
Перенос прикладных данных из транзакционных источников в
Хранилища Данных, включая анализ и очистку данных и
трансформацию данных
Data movement style
Интеграция данных, операций и управления на основе
конвейера для разнородных типов данных (структурированных,
неструктурированных, потоковых, облачных и т. д.),
поддерживающее как интеграцию, так и обработку
распределенным способом
Interoperability
Data processing and integration style
<<Sources…>>
IoT Data Stream
Web Services
ML/Predictive
Unstructured Data
Databases
Files
Batch
SAP Data
Services
Batch
Applications
Databases
SAP Data Intelligence
Orchestration
C ollect
Enterprise Data
HANA
Prepare
Enrich
R efine
Orchestrate
Data Warehouse
Data Lake/
Object Storages
•
BI / Традиционное Хранилище Данных, Миграция данных, Анализ качества данных
•
Data science & машинное обучение, Big Data, IoT, Data Network
•
ETL в гетерогенном ландшафте
•
Поддержка различных методов сбора данных
•
Централизованная on premise инфраструктура
•
Конвейеры для оркестрации данные в комплексном ландшафте
•
Фокус на реляционные данные
•
•
Комплексные трансформации данных & обработка (Join, SQL, DQ…)
Варианты развёртывания Cloud & on-premise, распределенная обработка данных и
серверные вычисления через Kubernetes
•
Фокус на Big data (таблицы/ракурсы, хранилища документов, любые типы данных)
•
Комплексные сценарии очистки и обработки данных (L, Фото/Видео, собственный код)
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
24
Взаимодополняющие решения – SAP Data Intelligence & Data Services
1
SAP Data Intelligence
Streaming
2
Machine
Sensor
3
Orchestration
SAP Data
Services
CRM
Refine
C ollect
Machine Learning
Prepare
Enrich
R efine
5
4
SAP BW/4HANA
Orchestration
Orchestrate
Extract
Transform
Deduplicate
Data
Stores
Database
1
Сбор больших объемов
данных (расстояние,
темп, сердечный ритм,
местоположение ...) от
датчиков машины с
помощью оператора
MQTT / Kafka (SAP Data
Intelligence)
Cloud
GCS | S3 | WASM
2
3
Подготовка данных в
соответствии с
назначением и
сохранение в одной из
подключенных систем
(SAP Data Intelligence)
Получение
дополнительных
релевантных
структурированных
данных (клиенты,
продажи, поведенческие,
демографические данные)
в хранилища данных
путем удаленной
организации заданий Data
Sservices
© 2020 SAP SE or an SAP affiliate company. All rights reserved. ǀ PUBLIC
Hadoop
HDFS
4
Применение алгоритмов
машинного обучения
(классификацию,
кластеризацию,
идентификацию
выбросов и т. д.) к
данным, чтобы получить
новые сведения о
пользовательских
характеристиках (SAP
Data Intelligence)
5
Вызов цепочки
загрузки данных для
передачи результатов
в SAP BW / 4HANA
для дальнейшего
анализа данных и
создания отчетов
(SAP Data Intelligence)
25
Follow us
www.sap.com/contactsap
© 2020 SAP SE or an SAP affiliate company. All rights reserved.
No part of this publication may be reproduced or transmitted in any form or for any purpose without the express permission of
SAP SE or an SAP affiliate company.
The information contained herein may be changed without prior notice. Some software products marketed by SAP SE and its
distributors contain proprietary software components of other software vendors. National product specifications may vary.
These materials are provided by SAP SE or an SAP affiliate company for informational purposes only, without representation or
warranty of any kind, and SAP or its affiliated companies shall not be liable for errors or omissions with respect to the materials.
The only warranties for SAP or SAP affiliate company products and services are those that are set forth in the express warranty
statements accompanying such products and services, if any. Nothing herein should be construed as constituting an additional
warranty.
In particular, SAP SE or its affiliated companies have no obligation to pursue any course of business outlined in this document or
any related presentation, or to develop or release any functionality mentioned therein. This document, or any related presentation,
and SAP SE’s or its affiliated companies’ strategy and possible future developments, products, and/or platforms, directions, and
functionality are all subject to change and may be changed by SAP SE or its affiliated companies at any time for any reason
without notice. The information in this document is not a commitment, promise, or legal obligation to deliver any material, code, or
functionality. All forward-looking statements are subject to various risks and uncertainties that could cause actual results to differ
materially from expectations. Readers are cautioned not to place undue reliance on these forward-looking statements, and they
should not be relied upon in making purchasing decisions.
SAP and other SAP products and services mentioned herein as well as their respective logos are trademarks or registered
trademarks of SAP SE (or an SAP affiliate company) in Germany and other countries. All other product and service names
mentioned are the trademarks of their respective companies.
See www.sap.com/copyright for additional trademark information and notices.
Download