当前位置: 华文问答 > 数码

毫无基础的人如何入门 Python ?

2015-11-12数码

0716更新

Python可以做什么?

Python的热度毋庸置疑,现在国内,不仅考国家二级计算机证需要学习Python,它甚至出现在了小学生的教材里。

那么高度如此高涨的Python,都可以用来做什么呢?

目前来说,Python有五大主要用途以及多类其他用途。

一、主要用途

1、Web开发

Python是一种解释型的脚本语言,用来开发Web应用,不但开发效率高,而且运行速度快。许多国内外的互联网公司将python作为主要开发语言:豆瓣、知乎、果壳网、Google、NASA、YouTube、Facebook……(再次感叹Python的强大)

除了大型的互联网公司,由于后台服务器的通用性,很多App和游戏也选择用 Python实现。

基于Python的Web框架有上百种,模板技术也比较成熟,其中常用的是Django、Flask、Tornado。

对于入门新手来说,Django和Flask可以说是首选,它们可以帮助你用Python编写服务器端代码(后端代码)。尤其是Flask,它要掌握的组件更少,能够实现简单、灵活和细致的控制,并能让你自己决定实现方式。

2、数据分析/可视化

Python拥有更加完备的生态环境,对于数据分析中会用到的分布式计算、数据库、可视化等,都有对应完成的模块。有一点要说,在你进行数据可视化时,可以选择Matplotlib,相对于其他的库来说更容易上手,当你掌握了它以后,也对你学习其他的库有所帮助。

Hadoop-MapReduce和Spark都可以用Python完成计算逻辑,这大概也是数据工程师、科学家钟爱Python的原因。

3、网络爬虫

说起Python的应用场景,最容易被提起来的就是网络爬虫。Google是最早用Python作为爬虫基础的公司,在此之前,人们如果想搜刮网上的内容,只能用采集器。

很多人在学了Python以后,都不知道干什么好,也无处施展,根本不了解自己对Python的掌握程度,这个时候,都可以试试爬虫。比如豆瓣的推荐电影列表、社区留言、音乐软件评论等,都可以用来做练习。

4、机器学习

说起人工智能,感觉前途无限好,周围很多人想参与进来,也让更多人对Python充满了学习的动力和期待。

人工智能需要更加精细的优化,也需要GPU、专用硬件之类的接口,因此人工智能的核心算法还是依赖于C/C++。那Python到底用来做什么呢?

Python是库的API binding,要开发一个其他语言到C/C++的跨语言接口,它是最容易的。

什么是机器学习呢?

我在网上看见过一个很容易理解的例子:

(以下为事例引用)

你将1000张狗的图片和1000张桌子的图片输入给机器学习算法,让它掌握狗和桌子间的区别。
那么当你给出新的图片让它识别是狗还是桌子时,它就能够进行判断。
这有点类似孩子学习新事物的方式。
孩子是如何学习认知狗或桌子的呢?就是通过大量的例子。
你不会明确告诉孩子:「如果某个毛茸茸的东西有浅棕色的毛发,那么就可能是狗。」
你会说,「这是狗,这也是狗。而这是桌子,那个也是桌子。「

机器学习的算法包括神经网络、深度学习、支持向量机及随机森林,基本道理和上述相似,应用场景很多:例如推荐系统、人脸识别及语音识别等。

对于机器学习库和Python框架,scikit-learn和TensorFlow算是两个比较热门的。

区别就在于:

scikit-learn带有一些内置的热门机器学习算法。 (适合刚开始进行机器学习项目)
TensorFlow是一个低级库,能让你创建自定义机器学习算法。 (适合解决效率问题)

5、自动化运维

Python写好的脚本语法简单,易于编写,而且进行测试也很快。

目前很多Linux发行版都很适合用Python脚本进行批量化的文件部署和运行调整。Python中也包含许多方便的工具,从调控ssh/sftp用的paramiko,到监控服务用的supervisor,再到bazel等构建工具,甚至conan等用于C++的包管理工具,都可以用Python实现。

二、其他应用(结合了自己的经验及网络应用)

嵌入式应用:Python可以与Rasberry Pi一起用,在硬件爱好者中很流行。

桌面应用:你可以用Python的Tkinter,但这并不是最热门的选择,Java,C#和C ++等语言似乎更受欢迎。

系统编程:提供API,能方便进行系统维护和管理,Linux下标志性语言之一,是很多系统管理员理想的编程工具。

数学处理:NumPy扩展提供大量与许多标准数学库的接口。

文本处理:Python提供的re模块能支持正则表达式,还提供SGML,XML分析模块,许多程序员利用Python进行XML程序的开发。

数据库编程:程序员可通过遵循PythonDB-API(数据库应用程序编程接口)规范的模块与MicrosoftSQLServer,Oracle,Sybase,DB2,MySQL、SQLite等数据库通信。Python自带有一个Gadfly模块,提供了一个完整的SQL环境。

网络编程:提供丰富的模块支持sockets编程,能方便快速地开发分布式应用程序。很多大规模软件开发计划例如Zope,Mnet及BitTorrent.Google都在广泛地使用它。

多媒体应用:Python的PyOpenGL模块封装了"OpenGL应用程序编程接口",能进行二维和三维图像处理。PyGame模块可用于编写游戏软件。

Python可以怎么学?

说实话,Python算是零基础友好的一大实用编程语言了。即便是没有计算机基础,也可以通过系统的学习过程来掌握它。

Python语法结构同时兼顾了面向对象编程的灵活性及函数式编程语言的方便性,给初学者大量的发挥空间,一般来说,如果你是在抱着认真负责的学习态度下,想掌握Python语言的语法结构,大概1-2周的时间就差不多。

学习网站可以选择菜鸟教程、Codecademy、Coursera和 CSDN。

  • 菜鸟教程
  • 站内的知识点很全面,无论你想学习哪种领域,都可以轻松在这里找到合适的资料。

  • Codecademy
  • 这个学习网站很大的优势就是在浏览器上直接编写代码,轻松解决了初学者程序环境安装的困扰。

  • Coursera
  • 如果你英文比较好,交流没有问题的话,比较推荐这个网站。这是一个课程学习网站,内容涵盖编程各个领域,目前已经和200+所大学合作课程,还可以在线读学士、硕士学位。

  • CSDN
  • 如果说你的英文是难题,给你推荐CSDN,是国内老牌程序员社区,里边有各领域博文、资料、课程,基本很多专业问题都可以在这里查。

    另外,我也结合了一些书和视频课,买书是因为文字落在纸面上,有助于及时理解和记忆;视频课的话,我是自学Python,因为还有工作,只能利用碎片时间去学,我为了苦学Python,在网易云课堂、51、慕课、CSDN学院买了不下10套关于Python入门的课,在得到也买了时间管理课。

    如果你跟我一样,想进行整体的学习,也想节省一些学习时间,加上我也比较懒,非得有人督促着才能坚持不懈,你可以试试体统学习,我选的是CSDN的Python训练营。

    如果有的同学目前是打算一步一步慢慢来,或者之前已经有一些基础,只是想突破单个方向,下边这几门课程我也在刚接触Python的时候买来学的,价格更便宜,内容却丝毫不打折扣,是比较值得学习的!

  • 基础知识
  • 如果是毫无基础可言,甚至不知道如何下载Python, 比较推荐齐伟老师的【8小时Python零基础轻松入门】或者是董付国的【Python可以这样学】。细节全面,适合小白入门。

  • 爬虫
  • 这回是偏基础点的,之前也分享过两门,都可以进行参考。

  • 数据分析
  • 我买过两类数据分析课,零基础入门和多方位学习,现在直接发出来,也是为了方便不同需求的同学。

  • 机器学习
  • 说起人工智能讲的好的老师,必说唐宇迪(感觉真的霸榜各个学习平台)。

    他是计算机的博士,好像还参与了挺多国家级项目,我听过几次他的课和直播,老师的讲课风格很幽默,经常会举例子,让你更清晰的搞懂知识点,我觉得自己是在学习中享受。

    (基础知识配实战,这样学习起来相对也更容易)

    最后要给你们推荐的是书的部分,我自己选了4本书:

  • 【笨办法学Python】
  • 如果是初学Python的话,没有什么编程基础,还是比较适合从这本开始学的。整体是以习题的方式开始引导初学者学习编程。

  • 【Python编程从入门到实践】
  • 这本书大概算是保姆级照顾了,细节描写不能再清晰。整体分为两个部分:基础知识和项目实战。不看真的不知道,代码类的实战项目竟然能在纸上讲清楚!

  • 【Python Cookbook】
  • 这本书既有知识点的详细讲解,又有更多高阶用法的延伸,对于已经有一定基础但是掌握不牢的同学来说,无疑是值得拥有的好书。

  • 【流畅的Python】
  • 这本书对于Python的高级用法探究很深入,涵盖了数据结构、对象、并行与并发、元编程等多个方向。

    也许有人会问:「你干嘛把自己逼得那么紧,安安稳稳的不就很好了吗?」

    作为一个人,如果长期处于一个舒适安逸的环境,慢慢就会被这种安逸笼罩,变得懒惰,原本拥有的能力也会逐步减弱,当有一天危险来临,所在的舒适圈被打破,连生存下去都是个难题!

    所以,为了好好活下去,要不跳出舒适圈,要不就扩大你的舒适圈。

    这些是我自己学习的时候用到的一些国内外网站+书籍+视频课,整体来说是够用的,如果还有其他更好的,各位同学可以评论区里分享出来,互换资源,共同学习!

    更新:

    有很多朋友私信问我Python学习有没有什么好的资料,我给大家找了几门不错的免费课,想学的可以看看。

    【Python入门教程】

    【Python初级入门精讲】

    【Python爬虫开发】

    【Python实战编程】

    【1小时掌握Python爬虫+高效学习法则】

    原回答:

    之前回答过很受知友们欢迎,再分享一下。

    Github上位名叫骆昊 (jackfrued) 的资深程序员,为大家规划了一条从「从新手到大师」的百天之路!我觉得这个模式你可以参考一下。

    现在已经有5w+星了!

    给初学者的几个建议:
  • Make English as your working language.
  • Practice makes perfect.
  • All experience comes from mistakes.
  • Don't be one of the leeches.
  • Either stand out or kicked out.

  • 先附上github地址:

    下面是这个一百天计划里面的学习框架,我在这里放上来。 (PS.对于毫无基础的人想百天完成这里面的学习计划就实话说根本是不可能的,我个人是比较认可这个学习框架的,大家没有必要严格卡这个100天,照着这个进程学习是完全可以的。)

    Day01~15 - Python语言基础

    Day01 - 初识Python

    Python简介 - Python的历史 / Python的优缺点 / Python的应用领域

    搭建编程环境 - Windows环境 / Linux环境 / MacOS环境

    从终端运行Python程序 - Hello, world / print函数 / 运行程序

    使用IDLE - 交互式环境(REPL) / 编写多行代码 / 运行程序 / 退出IDLE

    注释 - 注释的作用 / 单行注释 / 多行注释

    Day02 - 语言元素

    程序和进制 - 指令和程序 / 冯诺依曼机 / 二进制和十进制 / 八进制和十六进制

    变量和类型 - 变量的命名 / 变量的使用 / input函数 / 检查变量类型 / 类型转换

    数字和字符串 - 整数 / 浮点数 / 复数 / 字符串 / 字符串基本操作 / 字符编码

    运算符 - 数学运算符 / 赋值运算符 / 比较运算符 / 逻辑运算符 / 身份运算符 / 运算符的优先级

    应用案例 - 华氏温度转换成摄氏温度 / 输入圆的半径计算周长和面积 / 输入年份判断是否是闰年

    Day03 - 分支结构

    分支结构的应用场景 - 条件 / 缩进 / 代码块 / 流程图

    if语句 - 简单的if / if-else结构 / if-elif-else结构 / 嵌套的if

    应用案例 - 用户身份验证 / 英制单位与公制单位互换 / 掷骰子决定做什么 / 百分制成绩转等级制 / 分段函数求值 / 输入三条边的长度如果能构成三角形就计算周长和面积

    Day04 - 循环结构

    循环结构的应用场景 - 条件 / 缩进 / 代码块 / 流程图

    while循环 - 基本结构 / break语句 / continue语句

    for循环 - 基本结构 / range类型 / 循环中的分支结构 / 嵌套的循环 / 提前结束程序

    应用案例 - 1~100求和 / 判断素数 / 猜数字游戏 / 打印九九表 / 打印三角形图案 / 猴子吃桃 / 百钱百鸡

    Day05 - 构造程序逻辑

    基础练习 - 水仙花数 / 完美数 / 五人分鱼 / Fibonacci数列 / 回文素数

    综合练习 - Craps赌博游戏

    Day06 - 函数和模块的使用

    函数的作用 - 代码的坏味道 / 用函数封装功能模块

    定义函数 - def语句 / 函数名 / 参数列表 / return语句 / 调用自定义函数

    调用函数 - Python内置函数 / 导入模块和函数

    函数的参数 - 默认参数 / 可变参数 / 关键字参数 / 命名关键字参数

    函数的返回值 - 没有返回值 / 返回单个值 / 返回多个值

    作用域问题 - 局部作用域 / 嵌套作用域 / 全局作用域 / 内置作用域 / 和作用域相关的关键字

    用模块管理函数 - 模块的概念 / 用自定义模块管理函数 / 命名冲突的时候会怎样(同一个模块和不同的模块)

    Day07 - 字符串和常用数据结构

    字符串的使用 - 计算长度 / 下标运算 / 切片 / 常用方法

    列表基本用法 - 定义列表 / 用下表访问元素 / 下标越界 / 添加元素 / 删除元素 / 修改元素 / 切片 / 循环遍历

    列表常用操作 - 连接 / 复制(复制元素和复制数组) / 长度 / 排序 / 倒转 / 查找

    生成列表 - 使用range创建数字列表 / 生成表达式 / 生成器

    元组的使用 - 定义元组 / 使用元组中的值 / 修改元组变量 / 元组和列表转换

    集合基本用法 - 集合和列表的区别 / 创建集合 / 添加元素 / 删除元素 / 清空

    集合常用操作 - 交集 / 并集 / 差集 / 对称差 / 子集 / 超集

    字典的基本用法 - 字典的特点 / 创建字典 / 添加元素 / 删除元素 / 取值 / 清空

    字典常用操作 - keys()方法 / values()方法 / items()方法 / setdefault()方法

    基础练习 - 跑马灯效果 / 列表找最大元素 / 统计考试成绩的平均分 / Fibonacci数列 / 杨辉三角

    综合案例 - 双色球选号 / 井字棋

    Day08 - 面向对象编程基础

    类和对象 - 什么是类 / 什么是对象 / 面向对象其他相关概念

    定义类 - 基本结构 / 属性和方法 / 构造器 / 析构器 / __str__方法

    使用对象 - 创建对象 / 给对象发消息

    面向对象的四大支柱 - 抽象 / 封装 / 继承 / 多态

    基础练习 - 定义学生类 / 定义时钟类 / 定义图形类 / 定义汽车类

    Day09 - 面向对象进阶

    属性 - 类属性 / 实例属性 / 属性访问器 / 属性修改器 / 属性删除器 / 使用__slots__

    类中的方法 - 实例方法 / 类方法 / 静态方法

    运算符重载 - __add__ / __sub__ / __or__ /__getitem__ / __setitem__ / __len__ / __repr__ / __gt__ / __lt__ / __le__ / __ge__ / __eq__ / __ne__ / __contains__

    类(的对象)之间的关系 - 关联 / 继承 / 依赖

    继承和多态 - 什么是继承 / 继承的语法 / 调用父类方法 / 方法重写 / 类型判定 / 多重继承 / 菱形继承(钻石继承)和C3算法

    综合案例 - 工资结算系统 / 图书自动折扣系统 / 自定义分数类

    Day10 - 图形用户界面和游戏开发

    使用tkinter开发GUI

    使用pygame三方库开发游戏应用

    「大球吃小球」游戏

    Day11 - 文件和异常
  • 读文件 - 读取整个文件 / 逐行读取 / 文件路径
  • 写文件 - 覆盖写入 / 追加写入 / 文本文件 / 二进制文件
  • 异常处理 - 异常机制的重要性 / try-except代码块 / else代码块 / finally代码块 / 内置异常类型 / 异常栈 / raise语句
  • 数据持久化 - CSV文件概述 / csv模块的应用 / JSON数据格式 / json模块的应用
  • Day12 - 字符串和正则表达式
  • 字符串高级操作 - 转义字符 / 原始字符串 / 多行字符串 / in和 not in运算符 / is开头的方法 / join和split方法 / strip相关方法 / pyperclip模块 / 不变字符串和可变字符串 / StringIO的使用
  • 正则表达式入门 - 正则表达式的作用 / 元字符 / 转义 / 量词 / 分组 / 零宽断言 /贪婪匹配与惰性匹配懒惰 / 使用re模块实现正则表达式操作(匹配、搜索、替换、捕获)
  • 使用正则表达式 - re模块 / compile函数 / group和groups方法 / match方法 / search方法 / findall和finditer方法 / sub和subn方法 / split方法
  • 应用案例 - 使用正则表达式验证输入的字符串
  • Day13 - 进程和线程
  • 进程和线程的概念 - 什么是进程 / 什么是线程 / 多线程的应用场景
  • 使用进程 - fork函数 / multiprocessing模块 / 进程池 / 进程间通信
  • 使用线程 - thread模块 / threading模块 / Thread类 / Lock类 / Condition类 / 线程池
  • Day14 - 网络编程入门和网络应用开发
  • 计算机网络基础 - 计算机网络发展史 / 「TCP-IP」模型 / IP地址 / 端口 / 协议 / 其他相关概念
  • 网络应用模式 - 「客户端-服务器」模式 / 「浏览器-服务器」模式
  • 基于HTTP协议访问网络资源 - 网络API概述 / 访问URL / requests模块 / 解析JSON格式数据
  • Python网络编程 - 套接字的概念 / socket模块 / socket函数 / 创建TCP服务器 / 创建TCP客户端 / 创建UDP服务器 / 创建UDP客户端 / SocketServer模块
  • 电子邮件 - SMTP协议 / POP3协议 / IMAP协议 / smtplib模块 / poplib模块 / imaplib模块
  • 短信服务 - 调用短信服务网关
  • Day15 - 图像和文档处理
  • 用Pillow处理图片 - 图片读写 / 图片合成 / 几何变换 / 色彩转换 / 滤镜效果
  • 读写Word文档 - 文本内容的处理 / 段落 / 页眉和页脚 / 样式的处理
  • 读写Excel文件 - xlrd模块 / xlwt模块
  • 生成PDF文件 - pypdf2模块 / reportlab模块
  • Day16~Day20 - Python语言进阶

  • 常用数据结构
  • 函数的高级用法 - 「一等公民」 / 高阶函数 / Lambda函数 / 作用域和闭包 / 装饰器
  • 面向对象高级知识 - 「三大支柱」 / 类与类之间的关系 / 垃圾回收 / 魔术属性和方法 / 混入 / 元类 / 面向对象设计原则 / GoF设计模式
  • 迭代器和生成器 - 相关魔术方法 / 创建生成器的两种方式 /
  • 并发和异步编程 - 多线程 / 多进程 / 异步IO / async和await
  • Day21~30 - Web前端入门

  • 用HTML标签承载页面内容
  • 用CSS渲染页面
  • 用JavaScript处理交互式行为
  • jQuery入门和提高
  • Vue.js入门
  • Element的使用
  • Bootstrap的使用
  • Day31~35 - 玩转Linux操作系统

  • 操作系统发展史和Linux概述
  • Linux基础命令
  • Linux中的实用程序
  • Linux的文件系统
  • Vim编辑器的应用
  • 环境变量和Shell编程
  • 软件的安装和服务的配置
  • 网络访问和管理
  • 其他相关内容
  • Day36~40 - 数据库基础和进阶

  • 关系型数据库MySQL
  • 关系型数据库概述
  • MySQL的安装和使用
  • SQL的使用
  • DDL - 数据定义语言 - create / drop / alter
  • DML - 数据操作语言 - insert / delete / update / select
  • DCL - 数据控制语言 - grant / revoke
  • 相关知识
  • 范式理论 - 设计二维表的指导思想
  • 数据完整性
  • 数据一致性
  • 在Python中操作MySQL
  • NoSQL入门
  • NoSQL概述
  • Redis概述
  • Mongo概述
  • Day41~55 - 实战Django

    Day41 - 快速上手
  • Web应用工作原理和HTTP协议
  • Django框架概述
  • 5分钟快速上手
  • 使用视图模板
  • Day42 - 深入模型
  • 关系型数据库配置
  • 管理后台的使用
  • 使用ORM完成对模型的CRUD操作
  • Django模型最佳实践
  • 模型定义参考
  • Day43 - 静态资源和Ajax请求
  • 加载静态资源
  • 用Ajax请求获取数据
  • Day44 - 表单的应用
  • 表单和表单控件
  • 跨站请求伪造和CSRF令牌
  • Form和ModelForm
  • 表单验证
  • Day45 - Cookie和Session
  • 实现用户跟踪
  • cookie和session的关系
  • Django框架对session的支持
  • 视图函数中的cookie读写操作
  • Day46 - 报表和日志
  • 通过HttpResponse修改响应头
  • 使用StreamingHttpResponse处理大文件
  • 使用xlwt生成Excel报表
  • 使用reportlab生成PDF报表
  • 使用ECharts生成前端图表
  • 配置日志和Django-Debug-Toolbar
  • Day47 - 中间件的应用
  • 什么是中间件
  • Django框架内置的中间件
  • 自定义中间件及其应用场景
  • Day48 - 前后端分离开发入门
  • 返回JSON格式的数据
  • 用Vue.js渲染页面
  • Day49 - RESTful架构和DRF入门
    Day50 - RESTful架构和DRF进阶
    Day51 - 使用缓存
  • 网站优化第一定律
  • 在Django项目中使用Redis提供缓存服务
  • 在视图函数中读写缓存
  • 使用装饰器实现页面缓存
  • 为数据接口提供缓存服务
  • Day52 - 文件上传和富文本编辑
  • 文件上传表单控件和图片文件预览
  • 服务器端如何处理上传的文件
  • 富文本编辑器概述
  • wangEditor的使用
  • Day53 - 短信和邮件
  • 常用短信网关平台介绍
  • 使用螺丝帽发送短信
  • Django框架对邮件服务的支持
  • Day54 - 异步任务和定时任务
  • 网站优化第二定律
  • 配置消息队列服务
  • 在项目中使用celery实现任务异步化
  • 在项目中使用celery实现定时任务
  • Day55 - 单元测试和项目上线
  • Python中的单元测试
  • Django框架对单元测试的支持
  • 使用版本控制系统
  • 配置和使用uWSGI
  • 动静分离和Nginx配置
  • 配置HTTPS
  • Day56~60 - 实战Flask

    Day56 - Flask入门
    Day57 - 模板的使用
    Day58 - 表单的处理
    Day59 - 数据库操作
    Day60 - 项目实战

    Day61~65 - 实战Tornado

    Day61 - 预备知识
  • 并发编程
  • I/O模式和事件驱动
  • Day62 - Tornado入门
  • Tornado概述
  • 5分钟上手Tornado
  • 路由解析
  • 请求处理器
  • Day63 - 异步化
  • aiomysql和aioredis的使用
  • Day64 - WebSocket的应用
  • WebSocket简介
  • WebSocket服务器端编程
  • WebSocket客户端编程
  • 项目:Web聊天室
  • Day65 - 项目实战
  • 前后端分离开发和接口文档的撰写
  • 使用Vue.js实现前端渲染
  • 使用ECharts实现报表功能
  • 使用WebSocket实现推送服务
  • Day66~75 - 爬虫开发

    Day66 - 网络爬虫和相关工具
  • 网络爬虫的概念及其应用领域
  • 网络爬虫的合法性探讨
  • 开发网络爬虫的相关工具
  • 一个爬虫程序的构成
  • Day67 - 数据采集和解析
  • 数据采集的标准和三方库
  • 页面解析的三种方式:正则表达式解析 / XPath解析 / CSS选择器解析
  • Day68 - 存储数据
  • 如何存储海量数据
  • 实现数据的缓存
  • Day69 - 并发下载
  • 多线程和多进程
  • 异步I/O和协程
  • async和await关键字的使用
  • 三方库aiohttp的应用
  • Day70 - 解析动态内容
  • JavaScript逆向工程
  • 使用Selenium获取动态内容
  • Day71 - 表单交互和验证码处理
  • 自动提交表单
  • Cookie池的应用
  • 验证码处理
  • Day72 - Scrapy入门
  • Scrapy爬虫框架概述
  • 安装和使用Scrapy
  • Day73 - Scrapy高级应用
  • Spider的用法
  • 中间件的应用:下载中间件 / 蜘蛛中间件
  • Scrapy对接Selenium抓取动态内容
  • Scrapy部署到Docker
  • Day74 - Scrapy分布式实现
  • 分布式爬虫的原理
  • Scrapy分布式实现
  • 使用Scrapyd实现分布式部署
  • Day75 - 爬虫项目实战
  • 爬取招聘网站数据
  • 爬取房地产行业数据
  • 爬取二手车交易平台数据
  • Day76~90 - 数据处理和机器学习

    Day76 - 机器学习基础
    Day77 - Pandas的应用
    Day78 - NumPy和SciPy的应用
    Day79 - Matplotlib和数据可视化
    Day80 - k最近邻(KNN)分类
    Day81 - 决策树
    Day82 - 贝叶斯分类
    Day83 - 支持向量机(SVM)
    Day84 - K-均值聚类
    Day85 - 回归分析
    Day86 - 大数据分析入门
    Day87 - 大数据分析进阶
    Day88 - Tensorflow入门
    Day89 - Tensorflow实战
    Day90 - 推荐系统

    Day91~100 - 团队项目开发

    第91天:团队项目开发准备
    1. 软件过程模型
  • 经典过程模型(瀑布模型)
  • 可行性分析(研究做还是不做),输出【可行性分析报告】。
  • 需求分析(研究做什么),输出【需求规格说明书】和产品界面原型图。
  • 概要设计和详细设计,输出概念模型图、物理模型图、类图、时序图等。
  • 编码 / 测试。
  • 上线 / 维护。
  • 敏捷开发(Scrum)- 产品所有者、Scrum Master、研发人员 - Sprint
  • 产品的Backlog(用户故事、产品原型)。
  • 计划会议(评估和预算)。
  • 日常开发(站立会议、番茄工作法、结对编程、测试先行、代码重构……)。
  • 修复bug(问题描述、重现步骤、测试人员、被指派人)。
  • 评审会议(Showcase)。
  • 回顾会议(当前周期做得好和不好的地方)。
  • 补充:敏捷软件开发宣言
  • 个体和互动 高于 流程和工具
  • 工作的软件 高于 详尽的文档
  • 客户合作 高于 合同谈判
  • 响应变化 高于 遵循计划
  • 角色:产品所有者(决定做什么,能对需求拍板的人)、团队负责人(解决各种问题,专注如何更好的工作,屏蔽外部对开发团队的影响)、开发团队(项目执行人员,具体指开发人员和测试人员)。
    准备工作:商业案例和资金、合同、憧憬、初始产品需求、初始发布计划、入股、组建团队。
    敏捷团队通常人数为8-10人。
    工作量估算:将开发任务量化,包括原型、Logo设计、UI设计、前端开发等,尽量把每个工作分解到最小任务量,最小任务量标准为工作时间不能超过两天,然后估算总体项目时间。把每个任务都贴在白板上面,白板上分三部分:to do(待完成)、in progress(进行中)和done(已完成)。
    1. 项目团队组建
    团队的构成和角色
    说明:谢谢付祥英女士绘制了下面这张精美的公司组织架构图。
  • 编程规范和代码审查(flake8、pylint)
  • Python中的一些「惯例」(请参考【Python惯例-如何编写Pythonic的代码】)
    影响代码可读性的原因:
  • 代码注释太少或者没有注释
  • 代码破坏了语言的最佳实践
  • 反模式编程(意大利面代码、复制-黏贴编程、自负编程、……)
  • 2.团队开发工具介绍

  • 版本控制:Git、Mercury
  • 缺陷管理:Gitlab、Redmine
  • 敏捷闭环工具:禅道、JIRA
  • 持续集成:Jenkins、Travis-CI
  • 请参考【团队项目开发】。

    项目选题和理解业务

    1. 选题范围设定
    CMS(用户端):新闻聚合网站、问答/分享社区、影评/书评网站等。
    MIS(用户端+管理端):KMS、KPI考核系统、HRS、CRM系统、供应链系统、仓储管理系统等。
    App后台(管理端+数据接口):二手交易类、报刊杂志类、小众电商类、新闻资讯类、旅游类、社交类、阅读类等。
    其他类型:自身行业背景和工作经验、业务容易理解和把控。

    2.需求理解、模块划分和任务分配

    需求理解:头脑风暴和竞品分析。
    模块划分:画思维导图(XMind),每个模块是一个枝节点,每个具体的功能是一个叶节点(用动词表述),需要确保每个叶节点无法再生出新节点,确定每个叶子节点的重要性、优先级和工作量。
    任务分配:由项目负责人根据上面的指标为每个团队成员分配任务。

    3.制定项目进度表(每日更新)

    第92天:Docker的使用

    第93天:数据库设计和OOAD

    概念模型和正向工程

    1. UML(统一建模语言)的类图
    1. 通过模型创建表(正向工程)
      python manage.py makemigrations app python manage.py migrate

    物理模型和反向工程

    1. PowerDesigner

    2.通过数据表创建模型(反向工程)
    python manage.py inspectdb > app/models.py

    第94天:网络API接口设计
    第95天:使用Django开发项目

    项目开发中的公共问题

    数据库的配置(多数据库、主从复制、数据库路由)
    缓存的配置(分区缓存、键设置、超时设置、主从复制、故障恢复(哨兵))
    日志的配置
    分析和调试(Django-Debug-ToolBar)
    好用的Python模块(日期计算、图像处理、数据加密、三方API)

    REST API设计

    1. RESTful架构
  • 理解RESTful架构
  • RESTful API设计指南
  • RESTful API最佳实践
    1. API接口文档的撰写
  • RAP2
  • YAPI
    1. django-REST-framework的应用

    项目中的重点难点剖析

    1. 使用缓存缓解数据库压力 - Redis
    2. 使用消息队列做解耦合和削峰 - Celery + RabbitMQ

    第96天:软件测试和自动化测试

    单元测试

    1. 测试的种类
    2. 编写单元测试(unittest、pytest、nose2、tox、ddt、……)
    3. 测试覆盖率(coverage)

    项目部署

    1. 部署前的准备工作
  • 关键设置(SECRET_KEY / DEBUG / ALLOWED_HOSTS / 缓存 / 数据库)
  • HTTPS / CSRF_COOKIE_SECUR / SESSION_COOKIE_SECURE
  • 日志相关配置
    1. Linux常用命令回顾
    2. Linux常用服务的安装和配置
    3. uWSGI/Gunicorn和Nginx的使用
    Gunicorn和uWSGI的比较
  • 对于不需要大量定制化的简单应用程序,Gunicorn是一个不错的选择,uWSGI的学习曲线比Gunicorn要陡峭得多,Gunicorn的默认参数就已经能够适应大多数应用程序。
  • uWSGI支持异构部署。
  • 由于Nginx本身支持uWSGI,在线上一般都将Nginx和uWSGI捆绑在一起部署,而且uWSGI属于功能齐全且高度定制的WSGI中间件。
  • 在性能上,Gunicorn和uWSGI其实表现相当。
    1. 虚拟化技术(Docker)

    性能测试

    1. AB的使用
    2. SQLslap的使用
    3. sysbench的使用

    自动化测试

    1. 使用Shell和Python进行自动化测试
    2. 使用Selenium实现自动化测试
  • Selenium IDE
  • Selenium WebDriver
  • Selenium Remote Control
    1. 测试工具Robot Framework介绍
    第97天:电商网站技术要点剖析
    第98天:项目部署上线和性能调优
    1. MySQL数据库调优
    2. Web服务器性能优化

    3.代码性能调优

  • 多线程
  • 异步化
  • 4.静态资源访问优化

  • 云存储
  • CDN
  • 第99天:面试中的公共问题
    第100天:英语面试

    作者:骆昊 (jackfrued)

    来源:github

    github地址:https:// github.com/jackfrued/Py thon-100-Days

    另外,CSDN也出过一个图谱,

    希望能帮到你。