国内目前最快的dns(英伟达公认最快的dns)

数据中心转型

NVIDIA BlueField DPU (数据处理器)可用于加速网络功能。这种网络卸载可以使用 DPDK ,也可以用 NVIDIA DOCA 软件框架。

在本系列中,我构建了一个应用程序,并以两种方式卸载:DPDK 和 NVIDIA DOCA SDK 。我将每个步骤记录为单独的代码补丁,并在每个系列中提供完整的步骤。这部分将向您展示如何使用它 DPDK 编程 BlueField DPU 。

用例

首先,我需要一个简单但有意义的用例 DPU 上部署应用程序。我选择了基于策略的路由( PBR )来根据第 3 层和第 4 层数据包属性将流量引导到不同的网关,覆盖(或补充) X86 主机选择的网关。现实世界中需要这样做的原因有很多,包括以下示例:

· 将选定的主机流量发送到外部防火墙进行额外审核

· 增强 anycast 负载平衡服务器

· 应用 QoS

国内目前最快的dns(英伟达公认最快的dns)

图 1 . 使用 PBR 将流量从主机引导到两个网关之一

我在 DPU (BF2-ARM)上使用 PBR 流量来自主机( server1-x86 )引导两个网关 [leaf2, leaf3] 其中之一。叶交换机随后将流量转发给当地连接的选播服务提供商 [server2, server3] 。

构建应用程序

第一个问题:我是写一个新的应用程序,还是卸载一个现有的应用程序?

我决定卸载我最喜欢的开源路由软件栈 FRRouting ( frr )的 PBR 功能。这使我能够扩展现有的代码库和现有的代码库 sample apps 形成良好的对比。FRR 支持多种数据平面插件的框架可以轻松使用 DPDK 和 DOCA 实现新的数据平面插件并集成到 FRR 。

国内目前最快的dns(英伟达公认最快的dns)

图 2 . DPDK 和 DOCA 插件可以很容易地添加到 FRR中

DPU 应用程序原型

本节将介绍创作 DPU 应用程序需要准备硬件加速功能。

DPU 硬件

我有一个 x86 服务器安装在上面 BlueFied-2 DPU , 该 DPU 有两个 25G 上行链路和一个带 8GB 内存的 ARM 处理器 。更多关于硬件安装的信息,请参考 DOCA SDK 文档 。也可使用 DPU PocKit 构建和引导您的系统环境.

我安装了 BlueField 启动流文件( BFB ),它为 DPU 提供了 Ubuntu 操作系统图像附带 DOCA-1.2 和 DPDK-20.11.3 的库。

国内目前最快的dns(英伟达公认最快的dns)

图 3 . Netdev Representors

使用 SR-IOV ,我在主机上为两台虚拟机创建了两个虚拟函数( VF )接口。

国内目前最快的dns(英伟达公认最快的dns)

主机上的 PF 和 VF 分别映射到 DPU ARM 上的以下 netdev representors 。

国内目前最快的dns(英伟达公认最快的dns)

表 1 .主机上 PF 和 VF 的映射

使用 DPDK testpmd 原型设计应用程序

首先,我用 DPDK 的 testpmd 我的用例原型化设计,位于 DPU 的 / opt / mellanox / 目录下。

包括 testpmd 在内的任何 DPDK 必须设置所有应用程序 hugepages 。

国内目前最快的dns(英伟达公认最快的dns)

(可选)保留配置,使其在 DPU 重启后仍然有效。

国内目前最快的dns(英伟达公认最快的dns)

启动 testpmd 。

国内目前最快的dns(英伟达公认最快的dns)

Testpmd 会消耗更多的内存,默认情况下会分配 3.5 GB 。因为我不需要在那里 CPU 处理数据流量时,我会 total-mem 的值设定为 200M ,其中 total-mem = total-num-mbufs * mbuf-size (默认 mbuf-size 为 2048 字节)。我还使用了 flow-isolation 模式,因为我必须 ARP 数据包发送到 DPU 内核网络堆栈分析 PBR 下一跳)。初始化完成后,-i选项使得 testpmd 进入交互式 shell 。

作为 testpmd 完成 rte_eal 初始化的一部分, mlx5_pci 被探测并成为可访问的设备 DPDK 端口。

国内目前最快的dns(英伟达公认最快的dns)

你在这里看到的 DPDK 端口对应 PF / VF representor 和两个上行链路。

国内目前最快的dns(英伟达公认最快的dns)

表 2 . DPDK 端口映射

流创建

接下来,通过定义 ingress port 、源 IP 、目标 IP 、我用协议和端口 rte_flow 下发了PBR规则。此外,我还定义了匹配数据包采用的方法 ACTION 。源 MAC 和目标 MAC 被重写, TTL 出口端口设置为物理上行链路 p0 。

国内目前最快的dns(英伟达公认最快的dns)

这条 PBR 规则从 VM1接收 DNS 并将其发送到特定的流量 GW ( leaf2, server2 )。我还故障定位,我还增加了一个计数器。

国内目前最快的dns(英伟达公认最快的dns)

DPU 卸载可以工作 Switch ( FDB )模式,也可以工作在 NIC 模式。在这个用例中,经过几次数据包修改后,我需要将流量从 X86 主机重定向到 25G 上行链路。所以从概念上讲,这里使用了 Switch ( FDB ) 模式,因此需要设置 rte_flow 的 transfer 属性。

流程验证

我从 VM1 发送了一些流量,看看它是否与我用 testpmd 创建的 flow 是否匹配,可以通过执行 query 命令来查看。

国内目前最快的dns(英伟达公认最快的dns)

结果是匹配的,在 leaf2/server2 上可以看到这些流量且具有修改后的数据包头。因为被操作的流量是 DNS ,所以为了测试流量,我从 VM1 发送 DNS 请求。为了控制流量速率和其他数据包字段,我使用 mz 来生成测试流量。

国内目前最快的dns(英伟达公认最快的dns)

另一个健全性检查是查看此流是否真的被卸载。有两种方法可以做到这一点:

· 在 Arm CPU 上使用 tcpdump 以确保内核不接收此类数据包。

· 检查硬件 eSwitch 是否有对应的流规则。

mlx_steering_dump 允许您查看硬件上已经下发成功的流规则。使用 git 下载并安装该工具。

国内目前最快的dns(英伟达公认最快的dns)

使用 mlx_steering_dump_parser.py 脚本验证硬件中下发的流规则。

国内目前最快的dns(英伟达公认最快的dns)

此命令打印出 testpmd 应用程序下发的所有流规则。我们可以看到硬件上设置的外部 头匹配信息和前面RTE_FLOW定义的匹配 [SIP = 172.20.0.8 , DIP = 172.30.0.8 , IP proto = UDP , UDP dport = 53] 是一致的。作为打印输出的一部分,流量计数器的值也被读取并被重置。

原型设计,作为应用程序设计思维过程的最后一步现在已经完成。我现在知道我可以在 DPDK 中建立一个 PBR 规则,把它安装在硬件中并对我们感兴趣的数据报文进行修改。现在在下一节中添加 DPDK 数据平面。

构建 DPDK 数据平面插件

在本节中,我将通过向 Zebra 添加一个 DPDK 数据平面插件,介绍 DPU 对 PBR进行 硬件加速的步骤。我将这些步骤分解为单独的代码提交,整个补丁集以 reference 的形式提供。

国内目前最快的dns(英伟达公认最快的dns)

图 4 .基于策略的路由 DPDK 卸载工作流

开发环境

由于目标体系结构是 DPU Arm ,因此可以直接在 DPU Arm上构建、在 X86 CPU 上交叉编译或在云中构建。在这篇文章中,我直接在 DPU Arm 上进行编码和构建。

以 root 用户身份运行应用程序

FRR 通常作为非 root 用户运行。FRR 可以下载和上传整个互联网路由表;这可能会出什么问题?然而,几乎所有的 DPDK 应用程序都是以 root 用户身份运行, DPDK 库和驱动程序也都是基于这样设计的。

经过多次实验,并使用 root 用户选项重新编译 FRR, 我还是无法让 FRR 作为非 root 用户工作。这是可以接受的,因为我在一个安全的空间,即 DPU Arm 中运行 FRR 。

向 Zebra 添加新插件

Zebra 是 FRR 中的一个守护进程,负责整合路由协议守护进程的更新并构建转发表。Zebra 还有一个基础设施,可以将这些转发表推送到像 Linux 内核这样的数据平面。

将 DPDK 共享库链接到 zebra

FRR 有自己的构建系统,限制直接导入外部 make 文件。由于 pkg-config 的简单优雅,将相关库链接到 Zebra 很容易。

我找到了 libdpdk.pc 并将其添加到 PKG_CONFIG_PATH 值中:

国内目前最快的dns(英伟达公认最快的dns)

FRR 有自己的构建系统,限制直接导入外部 make 文件。由于 pkg-config 的简单优雅,将相关库链接到 Zebra 很容易。

我找到了 libdpdk.pc 并将其添加到 PKG_CONFIG_PATH 值中:

国内目前最快的dns(英伟达公认最快的dns)

我在 FRR makefile (configure.ac)中为 DPDK 添加了 pkg check-and-define 宏。

国内目前最快的dns(英伟达公认最快的dns)

我将 DPDK libs和cflags抽象包含在zebra-dp-dpdk make 宏( zebra/subdir.am )中。

国内目前最快的dns(英伟达公认最快的dns)

有了这些,我就有了构建插件所需的所有头文件和库。

初始化硬件

第一步是初始化硬件。

国内目前最快的dns(英伟达公认最快的dns)

这将探测 PCIe 设备并填充 DPDK rte_eth_dev 数据库。

初始化端口

接下来设置硬件端口。

设置应用程序的端口映射

FRR 有自己的基于 Linux netdevs 表的接口(端口)表,该表使用 NetLink 更新填充,并使用 ifIndex 键值来索引。PBR 规则锚定到此表中的一个接口。要编程 PBR 数据平面条目,需要一个 Linux ifIndex 和 DPDK port-id 值之间的映射表。netdev 信息已经在 DPDK 驱动程序中可用,可以通过 rte_eth_dev_info_get 查询。

国内目前最快的dns(英伟达公认最快的dns)

配置硬件端口

此外,所有端口都需要置于 flow-isolation 模式并启动。

国内目前最快的dns(英伟达公认最快的dns)

Flow-isolation 模式将未命中数据包发送到内核网络堆栈,允许它处理 ARP 请求之类的事情。

国内目前最快的dns(英伟达公认最快的dns)

使用 rte _流 API 编程 PBR 规则

PBR 规则现在需要用 rte_flow 来编写,下面是一个示例规则:

国内目前最快的dns(英伟达公认最快的dns)

这些参数通过 rte_flow_attributes 、 rte_flow_item ( match ) 和 rte_flow_action 数据结构填充。

流属性

此数据结构用于指示 PBR 流用于分组重定向或 transfer flow 。

国内目前最快的dns(英伟达公认最快的dns)

流匹配项

DPDK 为数据包头中的每一层使用 {key, mask} 匹配结构:以太网、 IP 、 UDP 等。

国内目前最快的dns(英伟达公认最快的dns)

填充这些数据结构需要大量重复的代码。

流动作

DPDK 为每个 Action 使用单独的数据结构,然后允许您在创建流规则时以可变长度数组的形式提供所有 Actions 。有关 Actions 如下:

国内目前最快的dns(英伟达公认最快的dns)

流验证和创建

作为可选项,您可以验证 rte_flow_attr、rte_flow_item 和 rte_flow_action 列表。

国内目前最快的dns(英伟达公认最快的dns)

流验证通常用于检查底层 DPDK 驱动程序是否支持特定的流配置。流验证是一个可选步骤,在最后的代码中,您可以直接跳转到流创建。

国内目前最快的dns(英伟达公认最快的dns)

Rte_flow 命令被锚定到输入端口。可以创建多个流条目组并将这些组链起来。即使流条目不存在链的第一个组中,也就是不在组 0 中,它仍然必须锚定到输入端口。group-0 存在性能限制。

流量插入率在 group-0 中受到限制。要绕过该限制,您可以在 group-0 中安装一个默认流,以“跳转到 group-1 ”,然后在 group-1 中创建流规则。

流删除

流创建 API 返回一个流指针,该指针必须被缓存以进行后续的流删除。

国内目前最快的dns(英伟达公认最快的dns)

FRR-PBR 守护进程管理状态机来解析,添加或删除 PBR 流。因此,我不必使用 DPDK 的原生函数来老化 PBR 规则。

流量统计

在创建流时,我将计数操作附加到流。可用于查询流量统计信息和命中次数。

国内目前最快的dns(英伟达公认最快的dns)

为了便于测试和验证,我将该统计显示插入了 FRR 的 vtysh CLI 。

测试应用程序

我以 root 用户的身份启动了 FRR ,并通过 /etc/frr/daemons 文件启用了新添加的 DPDK 插件:

国内目前最快的dns(英伟达公认最快的dns)

DPDK-port 映射表的 FRR 接口已填充:

国内目前最快的dns(英伟达公认最快的dns)

接下来,我将 PBR 规则配置为匹配来自 VM1 的 DNS 流量,并使用 frr.conf 将其重定向到 leaf2 。

国内目前最快的dns(英伟达公认最快的dns)

我从 VM1 发送 DNS 查询到 anycast DNS 服务器。

国内目前最快的dns(英伟达公认最快的dns)

匹配流,并使用修改后的数据包头将流量转发到目的地 leaf2/server2 。这可以通过连接到流的计数器和使用 mlx_steering_dump 做硬件转储来验证。

国内目前最快的dns(英伟达公认最快的dns)

FRR 现在有一个功能齐全的 DPDK 数据平面插件,可以在 DPU 硬件上卸载 PBR 规则。

总结

这篇文章回顾了使用 DPDK RTE_FLOW库在 BlueField 上硬件加速 PBR 规则的 FRR 数据平面插件的创建。在下一篇文章中,我将带您了解 FRR DOCA 数据平面插件,并向您展示如何使用新的 DOCA_FLOW 库卸载 PBR 规则。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至827202335@qq.com 举报,一经查实,本站将立刻删除。文章链接:https://www.eztwang.com/dongtai/53901.html

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 2022年12月31日 14:41
下一篇 2022年12月31日 14:49

相关推荐

  • 微信头像无法更换怎么办?为什么会出现这样的问题?

    微信作为国内最受欢迎的社交软件之一,用户数量庞大,其功能的多样性也深受用户喜爱。其中,微信头像的更换是用户表达个性和情感的一种方式。然而,有些用户在尝试更换微信头像时,会遇到无法更换的问题。那么,这究竟是怎么回事呢?为什么会出现这样的问题呢?下面我们就来一探究竟。 首先,我们要明确微信头像无法更换可能有以下几种原因: 1. 网络问题:在更换头像的过程中,如果…

    2024年9月2日
    2600
  • 微信拉黑后还能重新加好友吗?如何操作?

    在现代社交生活中,微信成为了不可或缺的一部分。我们通过微信与亲朋好友保持联系,分享生活中的点滴。然而,在某些情况下,我们可能会因为种种原因将某位好友拉黑。那么,问题来了,微信拉黑后还能重新加好友吗?如果可以,又该如何操作呢? 答案是肯定的,微信拉黑后仍然可以重新添加好友。下面,我将为您详细介绍重新添加好友的具体操作步骤。 首先,我们需要明确一点:拉黑好友并不…

    2024年9月1日
    5300
  • 网课优缺点分析:如何选择最适合的学习方式?

    随着科技的发展,网络教育逐渐成为学习的重要方式之一。尤其在疫情期间,网课成为了众多学生和职场人士的主要学习途径。然而,网课既有其独特的优势,也存在一定的不足。面对如此多样化的学习方式,如何选择最适合自己的一款呢?本文将对网课的优缺点进行分析,以帮助大家找到最合适的学习方式。 一、网课的优点 1. 灵活性:网课摆脱了传统课堂时间和地点的限制,学员可以根据自己的…

    2024年8月31日
    1800
  • 多多买菜退款需要门店同意吗?正确流程是怎样的?

    线上购物已经成为我们日常生活的一部分,多多买菜便是其中的佼佼者。然而,在享受便利的同时,我们也可能会遇到退款的问题。那么,在使用多多买菜时,退款是否需要门店同意呢?正确的退款流程又是怎样的呢?接下来,我们就来一步步了解。 首先,我们需要明确一点,多多买菜的退款流程主要分为两类:一是有实体门店的商品,二是无实体门店的商品。 对于有实体门店的商品,退款是否需要门…

    2024年8月30日
    3900
  • 不用手机号可以注册抖音吗?有哪些替代方案?

    在互联网时代,抖音已成为大众娱乐的重要途径。然而,有些人出于隐私保护或其他原因,不愿意使用手机号注册抖音。那么,不用手机号可以注册抖音吗?答案是肯定的。本文将为您介绍几种抖音注册的替代方案。 1. 使用邮箱注册 抖音支持使用邮箱地址进行注册。在注册过程中,选择“邮箱注册”选项,输入您的邮箱地址,设置密码,按照提示完成验证即可。使用邮箱注册的好处是,可以避免手…

    2024年8月30日
    8400
  • 朋友验证消息是什么意思?如何在社交软件中正确处理?

    所谓朋友验证消息,是指当我们在社交软件上收到一个来自陌生人的好友请求时,对方通常会附带一条简短的文字信息,用于说明自己的身份和添加好友的原因。这样做的目的是为了让接收方更容易判断对方是否值得信任,从而决定是否通过好友请求。 在社交软件中正确处理朋友验证消息,以下几点建议或许能帮助你: 1. 审慎对待:在通过好友请求之前,一定要仔细阅读对方发送的朋友验证消息,…

    2024年8月29日
    3000
  • 寻找类似闲鱼的二手交易平台。

    随着互联网的普及和发展,二手交易平台日益受到人们的关注和喜爱。闲鱼作为我国知名的二手交易平台,为广大用户提供了一个便捷、高效的交易环境。然而,除了闲鱼之外,还有许多类似的二手交易平台值得我们去探索和利用。今天,就让我来为大家介绍几款类似的二手交易平台,希望能给大家带来更多的选择。 1. 转转 转转成立于2015年,是58同城旗下的二手交易平台。它依托于58同…

    2024年8月24日
    1200
  • 闲鱼分期付款是否可行?

    闲鱼,作为国内知名的二手交易平台,已经深入到大众的日常生活之中。在这个平台上,买家可以淘到物美价廉的二手商品,卖家则可以处理自己的闲置物品。然而,随着消费方式的多元化,分期付款购物逐渐成为一种趋势。那么,闲鱼分期付款是否可行呢? 首先,我们需要了解闲鱼平台的特点。闲鱼作为一个C2C的交易平台,其核心优势在于低价、多样的商品和便捷的交易流程。然而,分期付款涉及…

    2024年8月23日
    5100

发表回复

登录后才能评论

联系我们

18312384410

在线咨询: QQ交谈

邮件:827202335@qq.com

添加微信