《TCP/IP网络编程》学习笔记 | Chapter 19:Windows 平台下线程的使用
《TCP/IP网络编程》学习笔记 | Chapter 19:Windows 平台下线程的使用
- 《TCP/IP网络编程》学习笔记 | Chapter 19:Windows 平台下线程的使用
- 内核对象
- 内核对象的定义
- 内核对象归操作系统所有
- 基于 Windows 的线程创建
- 进程与线程的关系
- Windows 中线程的创建方法
- Windows 线程的销毁时间点
- 编写多线程程序的环境设置
- 创建“使用线程安全标准 C 函数”的线程
- 句柄、内核对象和 ID 间的关系
- 内核对象的 2 种状态
- 内核对象状态及状态查看
- 验证内核对象状态的 2 个函数
- 习题
- (1)下列关于内核对象的说法错误的是?
- (2)现代操作系统大部分都在操作系统级别支持线程。根据该情况判断下列描述中错误的是?
- (3)请比较从内存中完全销毁 Windows 线程和 Linux 线程的方法。
- (4)通过线程创建过程解释内核对象、线程、句柄之间的关系。
- (5)判断下列关于内核对象描述的正误。
- (6)请解释“auto-reset模式”和manual-reset模式”的内核对象。区分二者的内核对象特征是什么?
《TCP/IP网络编程》学习笔记 | Chapter 19:Windows 平台下线程的使用
内核对象
要想掌握 Windows 平台下的线程,应首先理解内核对象(Kernel Objects)的概念。
内核对象的定义
操作系统创建的资源有很多种,如进程、线程、文件及即将介绍的信号量、互斥量等。其中大部分都是通过程序员的请求创建的,而且请求方式各不相同。虽然存在一些差异,但它们之间也有如下共同点:都是由 Windows 操作系统创建并管理的资源。
不同资源类型在管理方式也有差异。例如,文件管理中应注册并更新文件相关的数据I/O位置、文件的打开模式(rcad or write)等。如果是线程,则应注册并维护线程ID、线程所属进程等信息。操作系统为了以记录相关信息的方式管理各种资源,在其内部生成数据块(结构体变量)。当然,每种资源需要维护的信息不同,所以每种资源拥有的数据块格式也有差异。这类数据块称为“内核对象”。
假设在 Windows 下创建了 mydata.txt 文件,此时 Windows 操作系统将生成 1 个数据块以便管理,该数据块就是内核对象。同理,Windows 在创建进程、线程、线程同步信号量时也会生成相应的内核对象,用于管理操作系统资源。
内核对象归操作系统所有
线程、文件等资源的创建请求均在进程内部完成,因此,很容易产生“此时创建的内核对象所有者就是进程”的错觉。其实,内核对象所有者是内核(操作系统),内核对象的创建、管理、销毁时机的决定等工作均由操作系统完成。
基于 Windows 的线程创建
进程与线程的关系
现代操作系统都支持线程,因此,非显式创建线程的程序可描述为“单一线程模型的应用程序”,显式创建单独线程的程序可描述为“多线程模型的应用程序”。这就意味着 main 函数的运行同样基于线程完成,此时进程可以比喻为装有线程的篮子,实际的运行主体是线程。
Windows 中线程的创建方法
#include <windows.h>HANDLE CreateThread(LPSECURITY_ATTRIBUTES lpThreadAttributes,SIZE_T dwStackSize,LPTHREAD_START_ROUTINE lpStartAddress,LPVOID lpParameter,DWORD dwCreationFlags,LPDWORD lpThreadId
);
参数:
- IpThreadAttributes:线程安全相关信息,使用默认设置时传递 NULL。
- dwStackSize:要分配给线程的栈大小,传递 0 时生成默认大小的栈。
- IpStartAddress:传递线程的 main 函数信息。
- lpParameter:调用 main 函数时传递的参数信息。
- dwCreationFlags:用于指定线程创建后的行为,传递 0 时,线程创建后立即进入可执行状态。
- IpThreadld:用于保存线程 ID 的变量地址值。
成功时返回线程句柄,失败时返回 NULL。
调用该函数将创建线程,操作系统为了管理这些资源也将同时创建内核对象。最后返回用于区分内核对象的整数型“句柄”(Handle)。
第 1 章已介绍过,句柄相当于 Linux的文件描述符。
上述定义看起来有些复杂,其实只需要考虑 IpStartAddress 和 lpParameter 这 2 个参数,剩下的只需传递 0 或 NULL 即可。
Windows 线程的销毁时间点
Windows 线程在首次调用的线程 main 函数返回时销毁(销毁时间点和销毁方法与 Linux 不同)。
还有其他方法可以终止线程,但最好的方法就是让线程main函数终止(返回)。
编写多线程程序的环境设置
旧的 VC++6.0版默认只包含支持单线程的库,需要自行配置。
在项目的属性-代码生成界面,可以检查运行库:
创建“使用线程安全标准 C 函数”的线程
通过 CreateThread 函数调用创建出的线程在使用 C/C++ 标准函数时并不稳定。
如果线程要调用 C/C++ 标准函数,需要通过如下方法创建线程:
#include <process.h>unitptr_t _beginthreadex(void *security,unsigned stack_size,unsigned (*start_address)(void *),void *arglist,unsigned initflag,unsigned *thrdaddr
);
上述函数与之前的 CreateThread 函数相比,参数个数及各参数的含义和顺序的相同,只是变量名和参数类型有所不同。因此,用上述函数替换 CreateThread 函数时,只需适当更改数据类型。上述函数的返回值类型 uintptr_t 是 64 位 unsigned 整数型。
程序示例:
在这里插入代码片
运行结果:
与 Linux 相同,Windows 同样在 main 函数返回后终止进程,也同时终止其中包含的所有线程。另外,如果对上述代码进行运行的话,最后输出的内容并非字符串"end of main",而是"running thread"。但这是在 main 函数返回后,完全销毁进程前输出的字符串。
句柄、内核对象和 ID 间的关系
线程属于操作系统管理资源,伴随内核对象的创建,为了引用内核对象而返回句柄。
可以通过句柄区分内核对象,通过内核对象可以区分线程,最终,线程句柄成为区分线程的工具。
句柄的整数值在不同进程中可能重复。通过 CreateThread/_beginthreadex 函数可以得到线程 ID,它用于区分操作系统创建的所有线程,在跨进程范围内不会重复。
内核对象的 2 种状态
应用程序实现过程中需要特别关注的信息被赋予某种“状态”。
线程终止状态又称 signaled 状态,未终止状态称为 non-signaled 状态。
内核对象状态及状态查看
进程或线程终止时,操作系统会把相应的内核对象改为 signaled 状态。
这也意味着,进程和线程的内核对象初始状态是 non-signaled 状态。
内核对象带有 1 个 boolean 变量,其初始值为 FALSE,此时的状态就是 non-signaled 状态。如果发生约定的情况,把该变量改为 TRUE,此时的状态就是 signaled 状态。内核对象类型不同,进入 signaled 状态的情况也有所区别(即对应事件也有区别)。
验证内核对象状态的 2 个函数
首先介绍 WaitForSingleObject 函数,该函数针对单个内核对象验证 signaled 状态。
#include<windows.h>DWORD WaitForSingleObject(HANDLE hHandle,DWORD dwMilliseconds
);
参数:
- hHandle:查看状态的内核对象句柄。
- dwMilliseconds:以 1ms 为单位指定超时,传递 INFINITE 时函数不会返回,直到内核对象变成 signaled状态。
进入 signaled 状态返回 WAIT_OBJECT_0,超时返回 WAIT_TIMEOUT,失败时返回 WAIT_FAILED。
该函数由于发生事件(变为 signaled 状态)返回时,有时会把相应内核对象再次改为 non-signaled 状态。这种可以再次进入 non-signaled 状态的内核对象称为“auto-reset模式”的内核对象,而不会自动跳转到 non-signaled 状态的内核对象称为“manual-reset模式”的内核对象。
WaitForMultipleObjects 函数与 WaitForSingleObject 函数不同,可以验证多个内核对象状态。
#include <windows.h>DWORD WaitForMultipleObjects(DWORD nCount,const HANDLE *lphHandles,BOOL bWaitAll,DWORD dwMilliseconds
);
参数:
- nCount:需验证的内核对象数。
- IpHandles:存有内核对象句柄的数组地址值。
- bWaitAll:如果为 TRUE,则所有内核对象全部变为 signaled 时返回;如果为 FALSE,则只要有 1 个对象的状态变为 signaled 就会返回。
- dwMilliseconds:以 1ms 为单指定超时,传递 INFINITE 时函数不会返回,直到内核对象变为 signaled 状态。
成功时返回事件信息,失败时返回 WAIT_FAILED。
下面利用 WaitForSingleObject 函数尝试解决示例的问题。
#include <stdio.h>
#include <stdlib.h>
#include <windows.h>
#include <process.h>unsigned WINAPI ThreadFunc(void *arg); // WINAPI 是 Windows 固有的关键字,表示遵守 _beginthreadex 函数的调用规定int main(int argc, char *argv[])
{HANDLE hThread;DWORD wr;unsigned threadID;int param = 5;hThread = (HANDLE)_beginthreadex(NULL, 0, ThreadFunc, (void *)¶m, 0, &threadID);if (hThread == 0){puts("_beginthreadex() error");return -1;}if ((wr = WaitForSingleObject(hThread, INFINITE)) == WAIT_FAILED){puts("thread wait error");return -1;}printf("wait result: %s \n", (wr == WAIT_OBJECT_0) ? "signaled" : "time-out");puts("end of main");system("pause");return 0;
}unsigned WINAPI ThreadFunc(void *arg)
{int cnt = *((int *)arg);for (int i = 0; i < cnt; i++){Sleep(1000);puts("runnning thread");}return 0;
}
运行结果:
可以看出,thread1_win.c 中的问题得到解决。
第 18 章在 Linux 平台下分析了临界区问题,本章最后的内容将留给 Windows 平台下的临界区问题。
#include <stdio.h>
#include <stdlib.h>
#include <windows.h>
#include <process.h>#define NUM_THREAD 50
unsigned WINAPI threadInc(void *arg);
unsigned WINAPI threadDes(void *arg);
long long num = 0;int main(int argc, char *argv[])
{HANDLE tHandles[NUM_THREAD];int i;printf("sizeof long long: %d \n", sizeof(long long));for (i = 0; i < NUM_THREAD; i++){if (i % 2)tHandles[i] = (HANDLE)_beginthreadex(NULL, 0, threadInc, NULL, 0, NULL);elsetHandles[i] = (HANDLE)_beginthreadex(NULL, 0, threadDes, NULL, 0, NULL);}WaitForMultipleObjects(NUM_THREAD, tHandles, TRUE, INFINITE);printf("result: %lld \n", num);system("pause");return 0;
}unsigned WINAPI threadInc(void *arg)
{int i;for (i = 0; i < 50000000; i++)num += 1;return 0;
}unsigned WINAPI threadDes(void *arg)
{int i;for (i = 0; i < 50000000; i++)num -= 1;return 0;
}
运行结果:
即使多运行几次也无法得到正确结果,而且每次结果都不同。可以利用第 20 章的同步技术得到预想的结果。
习题
(1)下列关于内核对象的说法错误的是?
a. 内核对象是操作系统保存各种资源信息的数据块。
b. 内核对象的所有者是创建该内核对象的进程。
c. 由用户进程创建并管理内核对象。
d. 无论操作系统创建和管理的资源类型是什么,内核对象的数据块结构都完全相同。
答:
b、c、d。
(2)现代操作系统大部分都在操作系统级别支持线程。根据该情况判断下列描述中错误的是?
a. 调用 main 函数的也是线程。
b. 如果进程不创建线程,则进程内不存在任何线程。
c. 多线程模型是进程内可以创建额外线程的程序类型。
d. 单一线程模型是进程内只额外创建 1 个线程的程序模型。
答:
b、d。
(3)请比较从内存中完全销毁 Windows 线程和 Linux 线程的方法。
(4)通过线程创建过程解释内核对象、线程、句柄之间的关系。
线程创建过程:
- 用户程序通过系统调用请求创建线程。
- 内核创建线程对象。
- 内核将线程对象的引用封装为句柄,返回给用户程序。
- 线程开始执行用户定义的 main 函数,代码运行在用户态。
- 当线程函数结束且所有句柄关闭,内核销毁线程对象。
总结:
内核对象是操作系统的核心资源管理者,线程是用户程序与内核协作的执行单元,句柄是用户程序安全访问内核对象的桥梁。三者通过线程创建过程紧密协作,确保资源的隔离性、安全性和高效管理。
(5)判断下列关于内核对象描述的正误。
- 内核对象只有 signaled 和 non- signaled 这 2 种状态。(×)
- 内核对象需要转为 signaled 状态时,需要程序员亲自将内核对象的状态改为 signaled 状态。(×)
- 线程的内核对象在线程运行时处于 sigaled 状态,线程终止则进入 non-signaled 状态。(×)
(6)请解释“auto-reset模式”和manual-reset模式”的内核对象。区分二者的内核对象特征是什么?
auto-reset 模式:当事件被触发,只有一个等待线程会被唤醒,随后事件自动重置为 non-signaled 状态。如果有多个线程在等待,只有一个线程能继续执行,其余线程继续等待。
manual-reset 模式:当事件被触发,所有等待线程都会被唤醒,事件保持 signaled 状态,直到手动重置为 non- signaled 状态。
选择哪种模式取决于具体需求:是唤醒单个线程还是多个线程。