SSIS教程![]() SSIS教程提供SQL Server集成服务的基本和高级概念。我们的SSIS教程是为初学者和专业人士设计的。 SQL Server集成服务是一种快速而灵活的数据仓库工具,用于数据提取、转换和数据加载。它可以很容易地将数据从一个数据库加载到另一个数据库,如SQL Server, Oracle, Excel文件等。 在本教程中,我们将讨论以下主题: 什么是SSIS?
SSIS是一个主要用于执行两个功能的工具:
什么是数据集成?数据集成是一个用于集成来自多个数据源的数据的过程。数据可以是异构数据,也可以是同构数据。数据可以是结构化、半结构化或非结构化的。在数据集成中,来自不同数据源的数据进行集成,形成一些有意义的数据。 实现数据集成的方法有: ![]()
数据集成的优势:![]()
为什么SSIS ?使用SSIS的原因如下: ![]()
SSIS是如何工作的?我们知道,SSIS是一个有两个功能的平台,即数据集成和工作流。数据转换和工作流创建任务都是使用SSIS包进行的。SSIS包由三个部分组成: ![]() 操作数据操作数据是用于集成来自多个数据源的数据以对数据执行附加操作的数据库。在将数据发送到数据仓库进行存储、报告或归档之前,它是存放当前操作的数据的地方。 ETL
ETL是一个三个字的概念,但它分为四个阶段: ![]() 截图:捕获阶段也称为提取阶段。在此阶段,它选择源数据或元数据,数据可以是任何格式,如xml文件、平面文件或任何数据库文件。 磨砂膏:在此阶段,将检查原始数据。它检查数据是否包含错误。它通过使用一些人工智能技术来检查数据的错误或不一致。简而言之,它验证产品的质量是否满足。 变换:这是ETL的第三阶段。转换是将原始格式转换为所需格式的过程。转换是根据用户需求建模或更改数据。更改可以是列数或行数的更改。 负载和索引:第四阶段是加载和索引。它加载数据并验证已处理的行数。一旦数据加载完成,就使用索引。索引帮助您跟踪数据仓库中加载的行数。索引还有助于识别数据,无论其格式是否正确。 数据仓库数据仓库是一个单一的、完整的、一致的数据存储,它是通过组合来自多个数据源的数据而形成的。 数据库和数据仓库的区别 答案既可以是也可以不是。数据库和数据仓库都具有较大的数据单元和相似的物理表示,但数据仓库中复杂查询的响应时间比数据库快。 SQL Server集成服务的要求安装SQL Server Integration Services的要求如下:
按照以下步骤安装SQL Server数据工具: 步骤1:点击链接https://docs.microsoft.com/en-us/sql/ssdt/previous-releases-of-sql-server-data-tools-ssdt-and-ssdt-bi?view=sql-server-2017下载SQL Server数据工具。 步骤2:当你点击上面的链接,屏幕显示如下: ![]() 在上面的屏幕中,选择要安装的SSDT版本。 步骤3:下载完成后,运行下载的文件。当你运行下载的文件时,出现如下所示的屏幕: ![]() 步骤4:单击Next按钮。 步骤5:选择visual studio实例和要在visual studio 2017中安装的工具。 ![]() 步骤6:点击安装按钮。 什么是SSIS方案?包是你在SSIS中编码的一个基本块。在这里,代码并不意味着你在用某种编程语言编码;它意味着你所做的发展。开发是在SSIS包中完成的。SSIS主要用于ETL进程,ETL进程在SSIS包内部执行。 SSIS包由三部分组成: ![]()
SSIS任务在SSIS包中,我们可以添加任务。任务是一个工作单元,我们将有不同类型的任务来执行不同类型的工作。有各种类型的任务,但我们将讨论在SSIS中最常用的任务:
让我们来看一些数据集成服务的工作示例。 数据流任务示例步骤1:首先,我们在Microsoft excel中创建一个excel文件。假设我在Microsoft Excel中创建学生数据库,学生表中的字段为student_id, student_name, marks和gender。 ![]() 步骤2:打开visual studio (SQL Server Data Tools)。 ![]() 步骤3:单击文件选项,然后移动到新建->项目。 ![]() 步骤4:点击Project,出现如下界面: ![]() 在上面的屏幕中,单击出现在面板最左边的Integration Services,然后单击Integration Services Project。 步骤5:点击后集成服务项目选项,屏幕显示如下: ![]() 上面的屏幕由控制流、数据流、参数、事件处理程序和包资源管理器五个选项卡组成。我们已经讨论了控制流和数据流,控制流和数据流都存在于SSIS包中。 步骤6:为了导入数据,我们首先需要创建数据库,我们在SQL Server数据库中创建表。我们知道学生数据在Excel文件中是可用的,我们想将数据导入SQL Server数据库中。为了实现这一点,我们首先需要在SQL Server中创建表。打开SQL Server Management studio。 第七步:创建学生数据库。右键单击数据库,然后单击新的数据库选择。 ![]() 第八步:在下面的截图中输入数据库名称: ![]() 我已经给出了StudentWarehouse作为数据库名称。 步骤9:点击好吧按钮。 第十步:现在,我们在StudentWarehouse数据库。右键单击表,然后单击新建表。 ![]() 步骤11:现在我们在表中添加字段,如student_id、student_name、标记和性别。我们将student_id设置为唯一标识每行的主键。 ![]() 上面的屏幕显示我们在一个表中添加了四个字段。在表中添加了所有字段后,通过提供一些有用的名称来保存表。假设我提供了student作为表名。 步骤12:回到视觉工作室。控制流包含数据流任务,在主窗口上拖放数据流任务。 ![]() 步骤13:当双击“数据流任务”时,控件自动从“控制流”移动到“数据流”,因此我们可以说“控制流”是数据流的容器。 步骤14:现在,我们可以在数据流中执行转换。我们希望从前面创建的Excel文件中提取数据,因此从面板最左侧的其他源中拖放Excel源。 ![]() 从上面的屏幕中,我们观察到红色的叉出现在Excel Source内部,这意味着该组件配置了Excel Source。 步骤十五:要配置组件,右键单击Excel源代码,然后单击Edit选项,如下面的截图所示: ![]() 步骤16:填写如下截图所示的细节: ![]() 步骤17:输入所有详细信息后,界面如下所示: ![]() 步骤18:点击Excel源代码。 ![]() 上面的屏幕显示了两个箭头,红色和蓝色箭头。蓝色箭头定义了我们从Excel文件中接收到的实际数据,红色箭头表示我们遇到的错误。现在我们必须执行转换,在执行转换之前,我们需要加载数据库。 步骤19:要加载数据库,请单击Other Destinations,然后单击Destination。 ![]() 20步:添加目的地后,将源连接到目的地。 ![]() 步骤21:在上面的步骤中,我们注意到adonet Destination中的红色叉,这意味着它没有配置组件。右键单击adonet目的地,然后点击编辑选项,如下面的截图所示: ![]() 22步:您需要指定配置管理器。 ![]() 23步:点击新按钮以添加连接管理器。当你点击新按钮,屏幕显示如下: ![]() 24步:添加Server名称,并在SQL Server中选择数据库名称。 ![]() 25步:单击OK按钮。 26步:添加要在其中加载数据的表名。 ![]() 27步:在下面的屏幕中,将输入源的字段映射到目标源的字段。 ![]() 28步:添加映射后,源连接到目的地,如下图所示: ![]() 29步:点击开始按钮以运行集成服务项目。当您运行项目时,数据被加载到目标,即,SQL Server. 使用实例执行SQL任务
![]() 在上面的屏幕中,我们观察到红色叉出现在Execute SQL Task中,这意味着连接管理器未配置执行SQL任务.要配置它,我们需要添加Connection Manager。
![]()
![]()
![]() 在上面的屏幕中,我们观察到的数据连接StudentWarehouse我们在上一步中创建的数据库已经可用。点击好吧按钮。
![]() 在上面的屏幕中,您需要输入任务的名称、描述、SQL语句(需要在表上执行的SQL任务)等详细信息。
![]() 在上面的例子中,我在SQLStatement中提供了insert命令。
![]()
![]()
![]() 在上面的屏幕中,打勾标记表明您的SQL任务已经成功完成。我们在前面的步骤中添加的插入语句已经执行,数据已经添加到表中。例如,学生1。
![]() 先决条件在学习SSIS之前,您必须具备SQL Server的基础知识。 观众我们的SSIS教程旨在帮助初学者和专业人士。 问题我们保证您在本SSIS教程中不会发现任何问题。但如果有任何错误或错误,请将错误贴在联系表格上。
下一个话题
#
|