术语表#
本术语表包含贯穿整个 Jupyter 书籍的术语。这些描述应该在生物图像分析的背景下进行解释。
数组#
一个常用术语,用于包含多个值的数据结构。在 Python 中,两种常见的数组类型是列表和元组。 多维数组也被称为矩阵和超栈。
二值化#
二值化是将图像分割成两类的行为:真和假。真通常指的是图像中存在对象的区域,也称为前景。 假指的是没有对象存在的背景区域。
二值图像#
二值图像是只包含两种不同强度的图像。根据使用的软件,可以是布尔值 True 和 False,数字如 0 和 1,或者像在 ImageJ 中的 0 和 255。 一个常见的定义是将 0 与 False 关联,将所有其他可能的值与 True 关联。
布尔值#
布尔类型的变量只能包含两个值:True 或 False。
分类#
分类是将细胞或像素等事物分类到不同类别(“类”)中的任务。
分类可以通过使用简单的经典方法(如 Python 的 if 语句)和使用更复杂的机器学习技术来实现。
聚类#
根据对象或像素的属性将它们分组在一起的算法称为聚类算法。这些算法可用于语义分割和细胞分类。
连通组件标记#
连通组件分析或标记是一类算法,通常以二值图像作为输入并生成标签图像。 这些算法对标记为对象的相邻像素进行相同标记。没有连接的像素被标记为不同。 另请参阅 Wikipedia。
卷积#
卷积是将图像和滤波器核组合以生成新图像的过程。对于每个像素,其强度和相邻像素的强度按照滤波器核的定义进行组合,以计算输出图像中对应像素的强度。
卷积神经网络#
卷积神经网络是一类常用于图像去噪、恢复和分割的机器学习算法。 这些算法使用模拟大脑功能的架构来学习如何执行回归或分类任务。
DataFrame#
pandas DataFrame 是一种模仿表格的数据结构。 DataFrame 通常被数据科学家用来存储表格数据,如定量测量,以进行统计分析。
深度学习#
深度学习,通常与深度卷积神经网络相关联,是一类具有高复杂性和大型架构的机器学习算法。 这些算法在越来越多的科学领域中使用,并证明优于经典算法。 另一方面,通常需要大量的训练数据和大量的计算资源来训练这些模型。
特征图像#
特征图像用于像素分类算法,如随机森林分类器。 这些图像是通过对图像数据应用滤波器产生的。
滤波器#
在图像处理中,滤波器是一种操作,它接受输入图像以生成输出图像。输入和输出图像可以具有不同的维度和大小。 线性图像处理滤波器是通过对图像应用卷积产生的。 非线性图像处理滤波器以非线性方式组合每个像素定义的局部邻域中的像素强度,例如通过确定该区域中的最小值、最大值或中值。
GPU#
图形处理单元。用于处理图像数据和训练机器学习算法,特别是深度学习算法。
超栈#
超栈这个术语在图像处理中常用于描述具有超过 3 个维度的图像数据集。额外的、通常是非空间维度可以是时间、波长或存储在参数图像中的其他信息。
实例分割#
识别单个图像的分割算法,例如以标签图像的形式分割实例。
强度图像#
强度图像通常由显微镜、相机和医学断层摄影设备产生。图像中像素的强度描述了物理测量,例如在采集期间击中探测器的光子数量。
核#
滤波器核描述了如何使用加权和来组合给定像素周围的局部像素强度,以卷积输入图像。
标签图像#
标签图像是一种图像,其中像素强度表示像素属于哪个对象。 例如,如果像素强度为 1,它属于对象 1。如果像素强度为 3,它属于对象 3。 顺序标记的图像中的最大强度对应于图像中的对象数量。
标记#
标记算法通常以图像作为输入并产生标签图像。这样,像素就与对象身份相关联。
列表#
列表是可以更改的数据结构,例如在 Python 编程中。可以在列表中添加、删除和更改项目。
机器学习#
机器学习是一类基于统计方法从数据中派生模型的算法。 例如,一个算法从人工生成的图像注释中学习如何注释其他图像,这就是一个学习机器。
矩阵#
多维值数组。二维矩阵可以解释为图像。三维矩阵通常称为图像堆栈。更高维度的矩阵也称为超栈。
参数图像#
参数图像或参数图是指给定像素强度表示给定对象测量值的图像。
例如,在纵横比图像中值为 2 的像素属于长度是宽度两倍的对象。另请参阅参数图。
像素分类#
像素分类是将像素分类到多个类别中的过程。通常,像素分类会产生表达语义分割的图像或概率图。
概率图#
概率图是一种图像,其中像素强度表示像素属于特定类别或类别的概率。这些图像是像素分类算法的常见中间结果。
随机森林分类器#
区域化#
将图像划分为多个区域。另请参阅标记。
回归#
在机器学习的背景下,回归是一类算法,试图将观察到的系统(例如移动细胞的视频)简化为数值(例如移动细胞的平均速度)。 另请参阅回归分析(维基百科)。
语义分割#
将像素与类别(如”细胞质”或”细胞核”)关联,但不指定具体是哪个细胞或细胞核。
顺序标记#
顺序标记是一种处理步骤,它接受任何标签图像并生成另一个满足条件的标签图像:0 到最大强度之间的每个整数像素强度都存在。 因此,如果图像包含值 4,则保证也存在像素值 1、2 和 3。 有些算法只能处理顺序标记的输入图像。
字符串#
常见编程语言中的字符串变量是包含文本的变量。从技术上讲,变量是字符的数组。
元组#
Python 中包含多个不能更改(不可变)值的数据结构。