当前位置: 首页 > news >正文

数据处理与统计分析篇-day03-Numpy环境搭建

概述

python优势

Python作为当下最为流行的编程语言之一

  1. 可以独立完成数据分析的各种任务

  2. 数据分析领域里有海量开源库

  3. 机器学习/深度学习领域最热门的编程语言

  4. 在爬虫,Web开发等领域均有应用

常用开源库

numpy

NumPy(NumericalPython) 是 Python 语言的一个扩展程序库。是一个运行速度非常快的数学库,主要用于数组计算

包含:

  1. 一个强大的N维数组对象 ndarray

  2. 广播功能函数

  3. 整合 C/C++/Fortran 代码的工具

  4. 线性代数、傅里叶变换、随机数生成等功能

pandas

Pandas是一个强大的分析结构化数据的工具集, 它的使用基础是Numpy(提供高性能的矩阵运算), 用于数据挖掘和数据分析,同时也提供数据清洗功能

  1. Pandas利器之 Series,是一种类似于一维数组的对象

  2. Pandas利器之 DataFrame,是Pandas中的一个表格型的数据结构

matplotlib

Matplotlib 是一个功能强大的数据可视化开源Python库

  1. Python中使用最多的图形绘图库

  2. 可以创建静态, 动态和交互式的图表

seaborn

Seaborn是一个Python数据可视化开源库

  1. 建立在matplotlib之上,并集成了pandas的数据结构

  2. Seaborn通过更简洁的API来绘制信息更丰富,更具吸引力的图像

  3. 面向数据集的API,与Pandas配合使用起来比直接使用Matplotlib更方便

Anaconda

前面笔记中有安装过程

Anaconda简介

Anaconda 是最流行的数据分析平台,全球两千多万人在使用

  1. Anaconda 附带了一大批常用数据科学包

  2. Anaconda 是在 conda(一个包管理器和环境管理器)上发展出来的

  3. 可以帮助你在计算机上安装和管理数据分析相关包

  4. 包含了虚拟环境管理工具

Anaconda使用

通过命令行创建虚拟环境

conda env list # 显示所有沙箱(虚拟环境)

conda create -n 虚拟环境名字 python=python版本 #创建虚拟环境

conda activate 虚拟环境名字 #进入虚拟环境

conda deactivate 虚拟环境名字 #退出虚拟环境

conda remove -n 虚拟环境名字 --all #删除虚拟环境

Jupyter Notebook使用

启动

通过终端启动 Jupyter Notebook

conda activate 虚拟环境名字

jupyter notebook

基本使用

快捷键

命令模式,按ESC进入
  1. Y,cell切换到Code模式

  2. M,cell切换到Markdown模式

  3. A,在当前cell的上面添加cell

  4. B,在当前cell的下面添加cell

  5. 双击D:删除当前cell

编辑模式,按Enter进入
  1. 多光标操作:Ctrl键点击鼠标(Mac:CMD+点击鼠标)回退:Ctrl+Z(Mac:CMD+Z)

  2. 重做:Ctrl+Y(Mac:CMD+Y)

  3. 补全代码:变量、方法后跟Tab键

  4. 为一行或多行代码添加/取消注释:Ctrl+/(Mac:CMD+/)

两种模式通用快捷键

Shift+Enter,执行本单元代码,并跳转到下一单元

Ctrl+Enter,执行本单元代码,留在本单元

cell行号前的 * ,表示代码正在运行

掌握Markdown标题和缩进

pycharm连接jupyter

连接本地

开启本地jupyter notebook服务

新建pycharm项目, 在新项目下新建jupyter文件.

建好后设置

设置连接应用后, 提示输入密码或者token, 在命令行中粘贴token

测试执行, 输出路径为本地则连接成功

连接虚拟机

连接虚拟机的方式与上述步骤一致, 只需要将步骤3中的地址换为虚拟机的即可

pycharm连接远程环境

添加SSH

删除远程环境


http://www.mrgr.cn/news/29601.html

相关文章:

  • WebRTC项目一对一视频
  • 【Excel】数据透视表分析方法大全
  • <项目代码>YOLOv8 番茄识别<目标检测>
  • Go:文件输入输出以及json解析
  • Ruby编程语言全景解析:从基础到进阶
  • leetcode-15-三数之和
  • 在Windows操作系统中,如何再命令提示符(cmd)中快速打开自启动文件夹?
  • TCP/IP Socket用于测试免费使用的服务器端
  • C++中类的创建和声明
  • Vmware虚拟机无法打开内核设备“\\.\Global\vmx86“的解决方法
  • Gitlab升级14.0.12-->14.3.6遇到的gitlab-ctl reconfigure错误
  • MySQL聚合统计和内置函数
  • JS基础:数组for循环年龄案例
  • 「已解决」KeyError: ‘getpwuid(): uid not found: 1004‘
  • WildFly概述
  • MYSQL常用基本操作总结
  • Selenium
  • iOS六大设计原则设计模式
  • 【高级数据结构】树状数组
  • 基于Redis实现幂等判断
  • MongoDB
  • 论文阅读--Planning-oriented Autonomous Driving(一)
  • 达梦数据库导入xml迁移到达梦数据库大文件导致中断问题解决方案记录?
  • 多目标优化算法(Multi-Objective Optimization Algorithms, MOOA)介绍
  • CTFShow-反序列化
  • C++面试题