怎么为机器学习工程设计Python接口

技术怎么为机器学习工程设计Python接口本篇内容主要讲解“怎么为机器学习工程设计Python接口”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么为机器学习工程设计Pyth

本文主要讲解如何为机器学习工程设计Python接口。感兴趣的朋友不妨看看。本文介绍的方法简单、快速、实用。让边肖学习“如何为机器学习工程设计Python接口”!

1.预测器只是一个Python Cortex。Cortex的核心是我们的预测器,本质上是一个预测API,包括所有的请求处理代码和依赖关系。预测器接口为这些预测API实现了一些简单的需求。

因为Cortex使用微服务来服务模型,所以预测器接口密切关注两件事:

初始化模型

提供预测

本着这种精神,Cortex的预测接口需要两个函数,即剩下的init__()和predict(),它们或多或少地实现了你所期望的:

importtorchf from transformers import pipeline classpysonpredictor : def _ _ init _ _(self,config):#UseGPUs,ifavailable device=0if torch . cuda . is _ available()-else-1 # Initializemodel self . summer=pipeline(任务=' summary ',设备=设备)defpredict(self,有效负载): # Generatepredictionsummary=self . summary(有效负载['text'],num_beams=4,length _ pension=2.0,最大值

初始化后,您可以将预测器视为Python对象,当用户查询端点时,将调用它的单个predict()函数。

这种方法最大的优点之一是对任何有软件工程经验的人来说都是直观的。不需要接触数据管道或模型训练代码。模型只是一个文件,预测器只是一个导入模型并运行predict()方法的对象。

然而,除了语法吸引力之外,这种方法还提供了一些关键的好处,即它如何补充更广泛的皮层方法。

ction>

2. 预测只是一个HTTP请求

为生产中提供预测服务而构建接口的复杂性之一是,输入几乎肯定会与模型的训练数据不同,至少在格式上是这样。

这在两个层面上起作用:

  • POST请求的主体不是一个NumPy数组,也不是您的模型用来处理的任何数据结构。

  • 机器学习工程就是使用模型来构建软件,这通常意味着使用模型来处理它们没有受过训练的数据,例如使用GPT-2来编写民间音乐。

因此,预测器接口不能对预测API的输入和输出固执己见。预测只是一个HTTP请求,开发人员可以随意处理它。例如,如果他们想部署一个多模型端点,并基于请求参数查询不同的模型,他们可以这样做:

import torchfrom transformers import pipelinefrom starlette.responses import JSONResponse
class PythonPredictor:    def __init__(self, config):        self.analyzer = pipeline(task="sentiment-analysis")        self.summarizer = pipeline(task="summarization")
    def predict(self, query_params, payload):        model_name = query_params.get("model")        if model_name == "sentiment":            return self.analyzer(payload["text"])[0]        elif model_name == "summarizer":            summary = self.summarizer(payload["text"])[0]        else:            return JSONResponse({"error": f"unknown model: {model_name}"}, status_code=400)     

虽然这个界面让开发者可以自由地使用他们的API做什么,它也提供了一些自然的范围,使皮质在基础设施方面更加固执己见。

例如,在后台Cortex使用FastAPI来设置请求路由。Cortex在这一层设置了许多与自动排序、监控和其他基础设施功能相关的过程,如果开发人员需要实现路由,这些功能可能会变得非常复杂。

但是,因为每个API都有一个predict()方法,所以每个API都有相同数量的路由—1。假设这允许Cortex在基础设施层面做更多的事情,而不限制工程师。

3.服务模型只是一个微服务

对于在生产中使用机器学习的人来说,规模是一个主要的问题。型号可能会很大(GPT-2大约是6 GB),计算成本高,并且可能有很高的延迟。特别是对于实时推断,扩大规模来处理流量是一项挑战——如果你的预算有限,情况更是如此。

为了解决这个问题,Cortex把预测器当作微型服务,可以水平伸缩。更具体地说,当开发人员进行Cortex部署时,Cortex将包含API,旋转为推理准备的集群,并进行部署。然后,它将API公开为负载平衡器背后的web服务,并配置自动缩放、更新和监视:

怎么为机器学习工程设计Python接口

预测器接口是此过程的基础,尽管它“只是”一个Python接口。

预测器接口所做的是强制打包代码,使其成为推理的单个原子单元。单个API所需的所有请求处理代码都包含在一个预测器中。这使得大脑皮层能够很容易地衡量预测因素。

通过这种方式,工程师不必做任何额外的工作——当然,除非他们想做一些调整——准备一个用于生产的API。一个皮层的部署是默认的生产准备就绪。

到此,相信大家对“怎么为机器学习工程设计Python接口”有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/118550.html

(0)

相关推荐

  • max是什么意思车上的,雷克萨斯max什么意思

    技术max是什么意思车上的,雷克萨斯max什么意思max的意思是最大max是什么意思车上的,如果是车内的max按键,那一般是空调的强冷按键。在发动机机油尺上,也有max。max是最高液位,添加机油时不要让液位超过max刻

    生活 2021年10月22日
  • Java学习笔记33——二维数组遍历

    技术Java学习笔记33——二维数组遍历 Java学习笔记33——二维数组遍历二维数组遍历
    /*二维数组遍历int[][] arr = {{1,2},{11,22,33},{100,200,300},{

    礼包 2021年12月1日
  • 香橙派Orange Pi 4开发板在Ubuntu系统下怎样使用python控制GPIO

    技术香橙派Orange Pi 4开发板在Ubuntu系统下怎样使用python控制GPIO这篇文章给大家分享的是有关香橙派Orange Pi 4开发板在Ubuntu系统下怎样使用python控制GPIO的内容。小编觉得挺

    攻略 2021年11月12日
  • mybatis日常语法有哪些

    技术mybatis日常语法有哪些mybatis日常语法有哪些,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。mybatis中的#和$的区别? #方式能够很大程

    攻略 2021年10月20日
  • 如何分析SQL Server中的SQL语句优化与效率问题

    技术如何分析SQL Server中的SQL语句优化与效率问题今天就跟大家聊聊有关如何分析SQL Server中的SQL语句优化与效率问题,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这

    攻略 2021年12月1日
  • 香港多IP香港多IP服务器可以做游戏代理吗

    技术香港多IP香港多IP服务器可以做游戏代理吗很多玩家候经常会发现无论是steam还是psn虽然游戏下载升级很快但是联机的时候质量很差,那么如何解决这一问题呢,不少用户想到利用游戏加速器,但是现在很多游戏加速器都推出了V

    礼包 2021年10月22日