重要:大家好,请保存本链接,各城市演讲资料的后续更新,都将在本链接发布。
组委会诚挚感谢每一位嘉宾、讲师、赞助伙伴以及参会者对 PyCon China 的支持。该资料仅作为开发者交流学习使用,如果进行商业行为,需获得大会组委会以及讲师的授权与许可。
更多资料更新动态,请关注 PyCon China 官方微信公众号 PyChina 。
再次感谢每位讲师对本届大会所做出的贡献。
本文为上海站资料分享,其他城市资料分享请访问对应链接:
幻灯片亦会同步到 GitHub:https://github.com/PyConChina/2019-Slides
演讲主题:Python 的永恒之美
我热衷于学习程序语言的设计,并且从 1998 年就开始接触 Python。Python 是一个艺术品,在这个演讲里我将会分享我个人认为 Python 中最美丽的部分。
演讲主题:构建 Python 物联网(IoT)图像分类解决方案并与 Azure 无服务器功能集成
这将会是一次十分有趣的演讲,首先,你将学到如何使用 Python 构建一个图片分类与 TTS 相结合的实用工具,这可以应用于超市收银台,用来帮助视障人士。接下来,我将讲述如何将图像分类工具与 Python Azure 相结合,并连接到一个实时 web 仪表板上。
通过这次演讲你将会学到如何用 Python 和免费的 Azure 服务来构建一个 IoT 图片分类系统,并用它来帮助你身边的人们。
演讲主题:从模块化到全球分发,Python 在 Serverless 领域你不能错过的最新功能
自从2014年AWS Lambda发布以来,整个云原生运算领域与产业开始整个加速进入无服务器时代,经过将近五年的迭代,现在AWS Serverless又有哪些最前沿的技术呢?
这个session我们将会从一个Python开发者的角度来理解AWS Serverless最新的功能,包括Lambda Layer为你的Python应用进行更好的拆分与封装,Custom Runtime来打造更弹性丰富的架构,AWS SAR(Serverless Application Repository)来实现代码与应用全球分发,最后我们会示范最新的AWS CDK环境如何从Infrastructure Is Code的角度,包括基础建设、本地测试、AWS Lambda应用全面用Python开发撰写,成为完全使用Python一站式开发、测试与全球部署的当代无服务器高手。
演讲主题:调试是一种新的发布:慢语言的意外优势(Debug is the new Release: The Unexpected Benefits of Slow Languages)
演讲主题:Python 调试新思路
首先将回顾已有的工具,列举常用的 Python 程序调试手段。传统的手段有一些不足之处,而最近的一些库给了我们启发,其实 Python 调试可以更加智能化。而所说的智能化调试,指的是用户设定目标变量,由调试工具自动根据程序执行流程溯源目标变量的变化过程,从而省去了用 pdb、 PyCharm 等工具手动单步执行的麻烦。基于这个思路,我会提出一种新的调试思路和工具(也是我最近几个月在做的项目)。
演讲主题:可视化的 Python debugger:从内部原理到日常使用
在这个演讲中将会分享 Python debugger 的内部原理,它们有什么局限,以及近几年来在我们努力之下取得了什么突破。这个演讲不仅会讨论本地运行 debug,也同时会涉及到远程 debug 以及对不同文件格式的 debug。最后,我会分享一些在 PyCharm IDE 里使用可视化 debugger 的实用小技巧。
敬请期待...
演讲主题:GIL 的过去和未来
什么是 GIL?CPython 为什么要引入 GIL?它为了解决什么问题?为什么 Python 这么慢?如何摆脱 GIL 的限制?本次分享将带领大家了解 GIL 的方方面面,从 GIL 的产生历史背景,GIL 的原理分析,到如何在应用层上避开 GIL,并聊一聊 GIL 的未来,PEP 554 Multiple Interpreters in the Stdlib 的提出能否解决 GIL 的问题?
演讲主题:Speed up file transfers and file copies in Python
演讲主题:Python语法扩展框架moshmosh和其上的CPython compatible JIT实现
模式匹配,大家想了很多年了。JIT,大家也想了很多年了。现在的模式匹配库,却远远不及其他语言内置的语言构造; 现在的JIT,却过于领域特定,局限于数值计算或者和脱离于CPython解释器。我们利用编译知识,基于一些意义重大的项目(如llvm, llvmlite), 实现了优化不同和use case程度的JIT实现; 同时也介绍了如何在现行python语法下扩展语义。
演讲主题:The dangerous Flask
关于 Flask 保密性的演讲 (itsdangerous, JWT, JWS)
演讲主题:基于 Flask 的 REST API 开发指南
作为一个微框架,轻量灵活的 Flask 很适合用来开发 REST API 服务。相对于 Django REST Framework 和 APIStar,Flask 有什么优势和缺点?为了减少工作量,我们通常会使用一些工具来辅助编写,面对 Flask-RESTful、Flask-RESTPlus、Flask-API、Webargs、Marshmallow 等扩展和工具库,我们应该如何选择?虽然我们经常使用 REST API 这个名称,但是大部分的 API 都不够 RESTful,那么什么样的 API 才能算是 REST API?在这个议题中,我们将对这几个问题逐一进行探讨,并了解如何使用 Flask 编写出功能完善的 REST API 服务。
https://github.com/greyli/pyconchina2019-api
演讲主题:Django 中的 GraphQL
比起RESTful风格的api,GraphQL从公布到现在依然没有普及开来。很多公司的开发者一直处于观望状态。LeetCode将全部接口迁移到GraphQL已有将近两年的时间,直到现在我们主站将近十几万行Django代码,几乎全部的接口都是GraphQL。本次演讲的主题主要是分享LeetCode是如何使用GraphQL来减轻开发的工作以及我们是如何解决使用GraphQL中发生的问题的。
https://slides.com/miloas/deck
演讲主题:Django Migration Under the Hood
Django强大的ORM几乎屏蔽了SQL的复杂性,让我们只要写 Python 代码,然后 python manage.py makemigrations & migrate,就可以让数据持久化起来。但是这两行命令的背后发生了什么呢?为什么有时候这个命令会执行失败呢?在部署的什么过程去执行最合适?在PyCon上我将和大家分享:
Django migrations的工作原理;
使用Django migrations会遇到的问题,如何从原理入手去解决问题;
部署 Django migrations 的最佳实践;
其他一些 migrations 的思路,如果做一个 migrations 平台,如何做数据库结构版本化,DDL 回滚;
https://gitpitch.com/laixintao/django-migrations-under-the-hood
演讲主题:从 thriftpy 中学习 rpc 协议
作为一款 rpc 协议,thrift 都有哪些优劣?
pure Python 实现的 thriftpy 和 thriftpy2,是如何分层以应对不同的要求?
微服务是近些年互联网潮流方向,只要谈到微服务必涉及 rpc 协议。来自 Facebook,并由 Apache 基金会持续维护的 thrift 协议正是其中的一员。
而为了更好地使用,饿了么采用纯 Python 重新实现了 thrift 协议。
深入了解 thriftpy,不仅可以更好地使用它。还可以了解一款 rpc 协议的必要构成,以及 Python 项目如何通过合理分层的架构,来支持多种通信协议和传输协议。
演讲主题:Mars:numpy 与 pandas 的并行和分布式加速器
Mars 已经于2018年11月开源(https://github.com/mars-project/mars)。目前,Mars 能将超过 70% 的 numpy 常见接口自动并行和分布式化,且正在大规模实现 pandas 接口的自动并行。那么 Mars 是如何自动将 numpy 和 pandas 等工具自动并行和分布式化的?Mars 在演进过程中又碰到了什么样的难题?Mars 的性能如何?关注系统设计的同学能从 Mars 的发展过程中得到什么经验教训?在这个演讲里都会得到解答。
演讲主题:使用Python训练和部署低精度模型
随着深度学习技术的不断进步,为了加快深度学习模型的运算速度,以及节约深度学习模型部署使用的内存,使用低精度浮点表示(半精度或者定点整数)来对深度学习模型进行训练正在逐渐地被应用于实践之中。本次演讲主要使用了TensorFlow的Python前端,介绍了如何使用Python来构建低精度模型,并且将该模型应用于训练之中,并且进一步将模型导出成TensorRT能够使用并运行的格式,从而完成模型的部署。希望对大家训练和上线深度学习模型有所帮助。
演讲主题:Python 的 NLP 实战分享-如何实现合同风险预测模型?
本演讲深入浅出的介绍用 Python 做自然语言处理 (NLP) 的理论与实战应用,并特别在多语言挑战和法律文本处理上加大力道,力图在30分钟内给听众以全新视野与启发。内容主要分为3段:
1. Python NLP 入门
介绍用 Python 做汉语 NLP 的理论基础和必备工具。
2. 多语言 NLP 攻略
处理其他语言的 NLP 工具、中文分词和日文分词的不同点、多语言 NLP 的注意事项等。
3. “Python 合同风险预测模型”实战经验分享
通过解析模型构建过程,包括 EDA、Cosine Similarity、BLUE、ROUGE 等类似度算法的结果比较、文章语义分析等,具体提升听众处理法律文本的能力。
人和语言总是离不开的,NLP可以处理森罗万象的生活中的语言现象,我希望通过这次的实战应用的内容,大家可以得到一些启发用Python去挑战自己感兴趣的领域的NLP。
敬请期待...
演讲主题:Python深度学习实践
去年很荣幸分享了Cloud TPU的主题,了解到大部分同学未涉猎深度学习领域,为了帮助大家快速入门以及了解最新的行业进展,特别准备了从mnist(深度学习的hello world)到CIFAR10, 从ImageNet到BERT/xlnet若干实战案例,结合常见问题分享最佳实践
演讲主题:Python机器学习性能优化——以BERT服务为例,从1到1000
说起Python,被吐槽最多的就是性能问题。但现实中不管是Youtube还是网易游戏,都用Python支撑起上亿的日活。近年大火的机器学习领域,Python也是毫无疑问的第一语言。那么如何利用好Profiler,精准定位性能瓶颈;如何利用各种黑科技,压榨语言和机器的性能极限,相信是大家比较关心的问题。本次我会分享香侬科技在Python深度学习服务开发中的最佳实践, 以基于BERT的服务为例,如何提升QPS从1到1000。
D会场:微软专场
演讲主题:Python 在 Azure Notebook 产品发展中的核心地位以及通过 Visual Studio Code 的最佳 Azure 实践
现场演示:如何通过 Visual Studio Code 远程进入 Azure 控制 TensorFlow 完成基于 Python 代码的真实深度学习模型开发,训练和部署场景;并在 Azure Notebook 友好展示/记录整个过程和可视化图表;为Python开发者带来在微软的开发工具 Visual Studio Code 和云平台 Azure 上的极致开发体验。
(文件过大,可以登录 PyChina 官网,进行下载 ppt 内容)
演讲主题:Azure Machine Learning for Python
全面增强 AI 开发生产力,支持自动化机器学习。能够更快地确定最优算法,特性和参数,同时创建 Pipelines 实现自动化的 AI 开发全生命周期。
全面支持各种开源框架,技术和多种工具:
TensorFlow、CNTK、Caffe2、Keras、MxNET、PyTorch、Scikit-learn、Jupyter notebook、VS Code……
灵活的模型管理,部署方式。利用最新的容器技术和框架,可以方便地部署在 Azure, on premises 和 IoT edge。
敬请期待...
演讲主题:基于Azure的Python机器学习
机器学习是目前非常火热的一个研究领域,而 Python 的易学习和开源活跃特性使其适合机器学习编程。Azure 给数据科学从业者提供了 SDK 和服务,以用于快速准备数据并训练和部署机器学习模型,提高生产效率并降低成本。
演讲主题:Python on Azure Function
本次主题将会带大家了解目前 Azure Function,以及 Python 在 Azure 中生态,同时,将会通过实验演示方式带大家模拟客户遇到的问题,如何用 Azure Function + Python 来快速解决。
(文件过大,可以登录 PyChina 官网,进行下载 ppt 内容)
演讲主题:开源 AIOps 数据中台搭建与 Python 的作用
根据 Gartner 的报告,AIOps 将在未来5-10年落地开花,并集中统一各种 Ops 平台(Dev、IT、Net、Sec),本议题介绍 AIOps 的核心作用、相关工程难点(数据采集、数据中台、智能算法、自动化等)与开源方案选择,并介绍 Python 在其中的主要作用,覆盖开源方案有:Kafka、ELK、K8S、Prometheus、Grafana、Graphite、Ansible、Airflow、Flink、TensorFlow、OpenTelemetry 等。
演讲主题:分层次构建应用系统的可观测性
在云计算环境中,微服务和容器等技术已经将应用系统运行态的复杂度再次提高,可观测性逐渐成为软件工程师们不可回避的问题。日志、指标和 APM 就是可观测性所谓的一体三面,需要先将以上三个方面都整合在统一的数据后台里,才可以进行有效的搜索、关联、索引和分析,同时还需要运用机器学习的辅佐来降低人工系统排错分析的难度和成本。本演讲还将通过 Elastic Stack 技术栈来展示对可观测性的应对之道和效果。
演讲主题:从零开始快速构建 DevOps 系统 - 一个小型 to B 团队的 DevOps 系统诞生之路
过去一年,我在一个 to B 创业公司,基于 Python 和其他开源软件构建了一个极简的 DevOps 系统,在这个过程中产生的一些思考和实践。
主题演讲:基于Python构建高稳定可扩展的自动化测试集群——网易游戏自动化测试实践分享
一套优秀的自动化测试体系,不仅可以帮助企业优化开发流程,提升产品质量,而且还能大幅度的提高测试效率,节省人力。
2年前,为了解决游戏自动化测试难题,提高自动化脚本编写效率,我们开源了Airtest(https://github.com/AirtestProject/Airtest) ,到目前为止,这套框架已经累计帮助近4万名海内的开发人员和测试人员搭建自动化测试流程,帮助了数千企业提升产品质量,提高测试效率。
但Airtest只是我们完整生态中的一部分,这次分享将首次从产品设计和技术架构的角度,分享网易游戏内部从底层测试框架到大规模测试集群构建,从支持全球真机测试的云平台到企业级自动化解决方案的完整实践。
演讲主题:Python 在量化投资领域的应用
中国量化投资近年来高速发展。但传统的基于 C++ 的量化投资工具给广大中小投资者设置了过多的门槛。而 Python 出现后,其灵活、易懂、高效便捷的特性使得越来越多的投资者可以进入量化投资领域。我将介绍 Python 在量化投资中数据处理、策略研究、交易执行、风险管理等方向的各种应用,涉及期货、期权、ETF 等适合进行量化化交易的金融品种。
演讲主题:当 Python 遇上 FPGA – PYNQ 开源项目的实践与体会
PYNQ 项目是 Xilinx 研究院发起的将丰富的 Python 生态与 FPGA 硬件编程结合的开源框架。这是全球第一次尝试将面向生产力的 Python 语言和面向应用加速的可定制计算架构(Domain Specific Architecture)结合。软件开发者通过 Python 编程就可以将 FPGA 并行计算和可灵活配置的特性应用于端设备,适用于加速广泛的应用。而硬件开发者(芯片设计)通过 PYNQ 框架可以快速获得 Python 支持加速其数据分析,展示等。目前在 PYNQ 开源社区中已经提供了上百个硬件加速 Overlay,其中包括人工智能推理、机器视觉、视频转码、数据压缩,工业物联网等。报告中将介绍利用该框架进行 ROS, Ray,OpenCV 等开源框架的实践,并分析 Python 语言对 FPGA 进行编程应用开发时对 FPGA 器件的影响,性能结果等,并介绍项目后续开发的线路图。
演讲主题:FPGA 助力 Python 加速计算
Workshop 主题:AWS Work Shop:在AWS部署与发布你面向全球的Python Serverless应用
学习与开发了一整天的Python,我该如何封装我的应用面向全球发布呢?
在这三小时的workshop里面,我们将会带你一步一步发布你的Python应用到无服务器环境成为全球开发者皆可使用的AWS Lambda Layer,并且介绍如何用最新的AWS CDK(Cloud Development Kit)来封装你的应用发布到无服务器容器环境(AWS Fargate)、无服务器函数环境(AWS Lambda)以及全受管的Kubernetes环境(Amazon EKS)。
1. AWS Serverless最新功能介绍,包括AWS Lambda Layer, AWS Lambda Custom Runtime, AWS Serverless App Repository等
2. 封装与发布你的Python Library成为AWS Lambda Layer并且面向全球发布
3. 进一步封装你的Python核心应用与Layer并且发布到AWS SAR(Serverless App Repository)
4. 生成与发布你的SAR Buttons提供全球用户一键部署
5. AWS CDK介绍
6. 在你自己熟悉的IDE运行AWS CDK in Python
7. 使用AWS CDK in Python来开发一个无服务器端网址应用
8. 使用AWS CDK 来开发与部署你的无服务器容器应用
9. 使用AWS CDK 来快速部署你的Amazon EKS(Elastic Kubernetes Service)应用
10. Q&A
演讲主题【链接世界的 Python Community】
演讲主题【500 行 Python 写一个渲染】
Live: https://gitpitch.com/tvytlx/in-60-seconds#/
Source: GitHub repo
演讲主题【基于 OwlReady2 的人机交】
演讲主题【Byte Code 的革】
演讲主题【使用 Sphinx 制作 Web 文】
演讲主题【一键将 C/C++ 代码转换为 Python 能调用的代】
演讲主题:【Python 虚拟环境和依赖管理工具大乱斗】
https://github.com/greyli/pyconchina2019-venv
更多资讯,请关注 PyCon China 官方微信公众号: PyChina