Python基础(lambda,np.random)
本文主要针对Python中lamdbda的介绍,和numpy中seed、choice、uniform等的介绍。
1. lambda
除了 def
语句,python还提供了一种生成函数对象的表达式形式。由于它与LISP语言中的一个工具类似,所以称为lambda。
就像 def
一样,这个表达式创建了一个之后能够调用的函数,但是它返回一个函数而不是将这个函数赋值给一个变量。这些就是 lambda
叫做匿名函数的原因。实际上,他常常以一种行内进行函数定义的方式使用,或者用作推迟执行一些代码。
lambda
的一般形式是关键字 lambda
之后跟着一个或多个参数(与一个 def
头部内用括号括起来的参数列表类似),紧跟着是一个冒号,之后是表达式
1
lambda arg1,arg2,argn: expression using arguments
由 lambda
表达式所返回的函数对象与由def创建并复制后的函数对象工作起来是完全一致的,但 lambda
有一些不同之处,让其扮演特定的角色时更有用:
lambda是一个表达式,而不是一个语句
因为这一点,lambda
可以出现在python语法不允许 def
出现的地方。此外,作为一个表达式,lambda
返回一个值(一个新的函数),可以选择性的赋值给一个变量。相反,def
语句总是得在头部将一个新的函数赋值给一个变量,而不是将这个函数作为结果返回。
lambda的主题是单个表达式,而不是一个代码块
这个 lambda
的主题简单的就好像放在 def
主体 return
语句中的代码一样。简单的将结果写成一个顺畅的表达式,而不是明确的返回。但由于它仅限于表达式,故 lambda
通常要比 def
功能少…你仅能够在 lambda
主体中封装有限的逻辑进去,因为他是一个为编写简单函数而设计的。除了上述这些差别,def
和 lambda
都能过做同样种类的工作。
def与lambda的相同用法
1
2
3
4
5
6
7
x = lambda x, y, z: x + y + z
x(2, 3, 4)
>>> 9
y = (lambda a='hello', b='world': a + b)
y(b='Python')
>>> 'hellopython'
为什么使用lambda
通常来说,lambda起到一种函数的速写作用,允许在使用的代码内嵌一个函数的定义,他完全是可选的(是可以使用 def
代替他们),但是在你仅需要切入一段可执行代码的情况下,它会带来一个更简洁的书写效果。
lambda
通常用来编写跳转表,也就是行为的列表或者字典,能够按照需求执行操作,比如以下(**表示乘方):
1
2
3
4
5
6
7
l = [lambda x: x ** 2, lambda x: x ** 3]
for f in l:
print(f(2))
>>> 4
>>> 8
print(l[0](3))
>>> 9
实际上,我们可以用python中的字典或者其他的数据结构来构建更多种类的行为表,从而做同样的事情。
map 函数
程序对列表或者其他序列常常要做的一件事就是对每个元素进行一个操作,并把其结果集合起来。
python提供了一个工具map,它会对一个序列对象中的每一个元素应用该的函数,并返回一个包含了所有函数调用结果的列表。
举个栗子,我们有一个列表,需要将列表的每一个字段+10,我们该如何操作?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
list_show = [1, 2, 3, 4]
# 方式1
new_list_show = []
for i in list_show:
new_list_show.append(i + 10)
print(new_list_show)
# 方式2
def adds(x):
return x + 10
print(list(map(adds, list_show)))
# 更优雅的方式3:
print(list(map(lambda x: x + 10, list_show)))
filter函数
filter
通过字面意思,大家就知道它的用处了,用于数据的过滤操作,它也是 lambda
的一个好基友,举个栗子。
我们需要过滤0-9中,能被2整除的数字组成一个列表,我们该如何操作?只需要一行代码:
1
2
print(list(filter(lambda x: x % 2 == 0,range(10))))
>>> [0, 2, 4, 6, 8]
2. np.random
2.1. .seed()
numpy.random.seed()
:设置 seed()
里的数字就相当于设置了一个盛有随机数的“聚宝盆”,一个数字代表一个“聚宝盆”,当我们在 seed()
的括号里设置相同的seed,“聚宝盆”就是一样的,那当然每次拿出的随机数就会相同(不要觉得就是从里面随机取数字,只要设置的seed相同取出地随机数就一样)。如果不设置seed,则每次会生成不同的随机数。(注:seed括号里的数值基本可以随便设置哦)。
下面给个例子,表明每次rand之前都要设置一次seed,只要设置的seed相同,那么产生的随机数就相同。
1
2
3
4
5
6
7
8
9
10
11
12
>>> np.random.seed(0)
>>> np.random.rand(4,3)
array([[0.5488135 , 0.71518937, 0.60276338],
[0.54488318, 0.4236548 , 0.64589411],
[0.43758721, 0.891773 , 0.96366276],
[0.38344152, 0.79172504, 0.52889492]])
>>> np.random.seed(0)
>>> np.random.rand(4,3)
array([[0.5488135 , 0.71518937, 0.60276338],
[0.54488318, 0.4236548 , 0.64589411],
[0.43758721, 0.891773 , 0.96366276],
[0.38344152, 0.79172504, 0.52889492]])
给随机生成器设置seed的目的是每次运行程序得到的随机数的值相同,这样方便测试。
但是 numpy.random.seed()
不是线程安全的,如果程序中有多个线程最好使用 numpy.random.RandomState
实例对象来创建或者使用random.seed()
来设置相同的随机数种子。
2.2. .RandomState()
numpy.random.RandomState()
是一个伪随机数生成器。那么伪随机数是什么呢?
伪随机数是用确定性的算法计算出来的似来自[0,1]均匀分布的随机数序列。并不真正的随机,但具有类似于随机数的统计特征,如均匀性、独立性等。
下面我们来看看它的用法:
1
2
3
4
5
6
7
>>> import numpy as np
>>> rng = np.random.RandomState(0)
>>> rng.rand(4)
array([0.5488135 , 0.71518937, 0.60276338, 0.54488318])
>>> rng = np.random.RandomState(0)
>>> rng.rand(4)
array([0.5488135 , 0.71518937, 0.60276338, 0.54488318])
看,是不是生成了一样的随机数组呢,这点和numpy.random.seed()还是很一样的。
因为是伪随机数,所以必须在rng这个变量下使用,如果不这样做,那么就得不到相同的随机数组了,即便你再次输入了numpy.random.RandomState():
1
2
3
4
5
6
7
8
np.random.RandomState(0)
Out[397]: <mtrand.RandomState at 0xddaa288>
np.random.rand(4)
Out[398]: array([0.62395295, 0.1156184 , 0.31728548, 0.41482621])
np.random.RandomState(0)
Out[399]: <mtrand.RandomState at 0xddaac38>
np.random.rand(4)
Out[400]: array([0.86630916, 0.25045537, 0.48303426, 0.98555979])
2.3. .choice()
choice()
方法返回一个列表,元组或字符串的随机项。注意:choice()是不能直接访问的,需要导入 random 模块,然后通过 random 静态对象调用该方法。
1
2
3
4
5
>>> import random
>>> print "choice([1, 2, 3, 5, 9]) : ", random.choice([1, 2, 3, 5, 9])
choice([1, 2, 3, 5, 9]) : 2
>>> print "choice('A String') : ", random.choice('A String')
choice('A String') : n
给定size参数后,可以生成指定size的随机数,如果需要每一次产生的随机数相同,则需要设置随机数种子,random.seed(int)
或者 random.RandomState(int)
。
1
2
3
4
import numpy as np
seed = 0
rng = np.random.RandomState(seed)
rng.choice(50, 10)
numpy.random.choice(a, size=None, replace=True, p=None)
- a : 如果是一维数组,就表示从这个一维数组中随机采样;如果是int型,就表示从0到a-1这个序列中随机采样。
- size : 采样结果的数量,默认为1.可以是整数,表示要采样的数量;也可以为tuple,如(m, n, k),则要采样的数量为m * n * k,size为(m, n, k)。
- replace : boolean型,采样的样本是否要更换?这个地方我不太理解,测了一下发现replace指定为True时,采样的元素会有重复;当replace指定为False时,采样不会重复。
- p : 一个一维数组,制定了a中每个元素采样的概率,若为默认的None,则a中每个元素被采样的概率相同。
2.4. .uniform()
uniform() 方法将随机生成下一个实数(浮点数),它在 [x, y] 范围内。注意:uniform()是不能直接访问的,需要导入 random 模块,然后通过 random 静态对象调用该方法。
1
2
import random
random.uniform(x, y)
其中x和y是随机数的取值界限,且不包含本身。
2.5. .permutation()
随机排列一个序列,返回一个排列的序列。
1
2
3
4
>>> np.random.permutation(10)
array([1, 7, 4, 3, 0, 9, 2, 5, 8, 6])
>>> np.random.permutation([1, 4, 9, 12, 15])
array([15, 1, 9, 4, 12])
与 random.shuffle(x) 的区别在于,shuffle直接改变原始数组x,而permutation不改变原数组,而是赋值给新数组。
如果x是int型,,则返回从0到x-1这个序列的随机顺序。
3. range()
函数语法:range(start, stop[, step])
参数说明:
start
: 计数从 start 开始。默认是从 0 开始。例如range(5)等价于range(0, 5);stop
: 计数到 stop 结束,但不包括 stop。例如:range(0, 5) 是[0, 1, 2, 3, 4]没有5;step
:步长,默认为1。例如:range(0, 5) 等价于 range(0, 5, 1)。
4. 参考文献
无。