【应用篇】09.自主Shell命令行解释器
一、目标
• 要能处理普通命令
• 要能处理内建命令
• 要能帮助我们理解内建命令/本地变量/环境变量这些概念
• 要能帮助我们理解shell的运行原理
二、实现原理
考虑下面这个与shell典型的互动:
[caryon@VM-24-10-centos ~]$ ls
code code.c code.cpp code_static linux shared_code.cpp shared_dir
[caryon@VM-24-10-centos ~]$ psPID TTY TIME CMD
13014 pts/0 00:00:00 bash
13288 pts/0 00:00:00 ps
用下图的时间轴来表示事件的发生次序。其中时间从左向右。shell由标识为sh的方块代表,它随着时间的流逝从左向右移动。shell从用户读入字符串"ls"。shell建立一个新的进程,然后在那个进程中运行ls程序并等待那个进程结束。
然后shell读取新的一行输入,建立一个新的进程,在这个进程中运行程序并等待这个进程结束。
所以要写一个shell,需要循环以下过程:
- 打印命令提示符
- 获取命令行
- 解析命令行
- 检查并执行内建命令
- 创建子进程执行普通命令
根据这些思路,和我们前面的学的技术,就可以自己来实现一个shell了。
三、实现
3.1 整体框架
int main()
{//用以命令行输入char command_buffer[basesize];//循环执行while(true){// 1. 打印命令行提示符PrintCommandLine(); // 2. 获取用户命令if( !GetCommandLine(command_buffer, basesize) ) continue;// 3. 分析命令ParseCommandLine(command_buffer, strlen(command_buffer)); // 5. 检查并执行内建命令if ( CheckAndExecBuiltCommand() )continue;// 4. 执行命令ExecuteCommand(); }return 0;
}
3.2 打印命令行提示符
通过环境变量来获取所需要的主机名,用户名,所处路径,并将其组合成字符串输出。
//获取用户名
string GetUserName()
{string name = getenv("USER");//不存在就返回Nonereturn name.empty() ? "None" : name;
}
//获取主机名
string GetHostName()
{string hostname = getenv("HOSTNAME");return hostname.empty() ? "None" : hostname;
}
//获取所处路径
string GetPwd()
{//初始时所写,无法完成命令行中的所处路径的切换string pwd = getenv("HOSTNAME");return pwd.empty() ? "None" : pwd;
}
//组装成字符串
string MakeCommandLine()
{char command_line[basesize];snprintf(command_line, basesize, "[%s@%s %s]# ",GetUserName().c_str(), GetHostName().c_str(), GetPwd().c_str());return command_line;
}
//打印命令行提示符
void PrintCommandLine()
{printf("%s", MakeCommandLine().c_str());fflush(stdout);
}
3.3 获取命令行输入
通过fgets获取用户的输入,然后去除掉’\n’。
//如果获取失败就continue,进入下一次循环
bool GetCommandLine(char command_buffer[], int size)
{char *result = fgets(command_buffer, size, stdin);if(!result)return false;//去除\ncommand_buffer[strlen(command_buffer)-1] = 0;if(strlen(command_buffer) == 0) return false;return true;
}
3.4 分析命令
将输入的指令使用C语言中的strtok进行切割打散成指针数组,利用gargc计数,gargv进行存储。
//分析命令
void ParseCommandLine(char command_buffer[], int len)
{(void)len;//每次都将命令行参数列表置空,命令行参数个数置0memset(gargv, 0, sizeof(gargv));gargc = 0;const char *sep = " ";gargv[gargc++] = strtok(command_buffer, sep);// =是刻意写的while(gargv[gargc++] = strtok(nullptr, sep));gargc--;
}
3.5 执行命令
创建子进程,让子进程调用exec系列接口去执行命令,父进程等待。
bool ExecuteCommand() // 4. 执行命令
{// 让子进程进行执行pid_t id = fork();if(id < 0) return false;if(id == 0){//子进程// 1. 执行命令execvp(gargv[0], gargv);// 2. 退出exit(0);}//父进程int status = 0;pid_t rid = waitpid(id, &status, 0);return false;
}
3.6 检查并执行内建命令
当我们执行cd命令时,我们发现时无效的,这是因为每个进程都有自己的当前路径,我们的cd想改变的是当前shell的工作路径,这就需要shell自己去执行。这样的命令我们称之为内建命令。
常见的内建命令:
• cd
• export
• env
• echo
我们通过枚举的方式将内建命令实现:
3.6.1 cd
//获取所处路径
const int basesize = 1024;
char pwd[basesize];
string GetPwd()
{//这里需要将pwd的获取重写,以达到能够获取当前工作路径的目的 if(nullptr == getcwd(pwd, sizeof(pwd))) return "None";snprintf(pwdenv, sizeof(pwdenv),"PWD=%s", pwd);return pwd;
}
if(strcmp(gargv[0], "cd") == 0)
{// 内建命令if(gargc == 2){//更改当前工作目录chdir(gargv[1]);}
}
3.6.2 export
const int argvnum = 64;
// 全局的命令行参数表
char *gargv[argvnum];
int gargc = 0;// 作为一个shell,获取环境变量应该从系统的配置来
// 我们就直接从父shell中获取环境变量
void InitEnv()
{extern char **environ;int index = 0;while(environ[index]){genv[index] = (char*)malloc(strlen(environ[index])+1);strncpy(genv[index], environ[index], strlen(environ[index])+1);index++;}genv[index] = nullptr;
}
//导入环境变量
void AddEnv(const char *item)
{int index = 0;while(genv[index])index++;genv[index] = (char*)malloc(strlen(item)+1);strncpy(genv[index], item, strlen(item)+1);genv[++index] = nullptr;
}
if(strcmp(gargv[0], "export") == 0)
{if(gargc == 2){AddEnv(gargv[1]);}
}
3.6.3 env
if(strcmp(gargv[0], "env") == 0)
{for(int i = 0; genv[i]; i++){printf("%s\n", genv[i]);}
}
3.6.4 echo
if(strcmp(gargv[0], "echo") == 0)
{if(gargc == 2){// echo $?// echo $PATH// echo helloif(gargv[1][0] == '$'){if(gargv[1][1] == '?'){printf("%d\n", lastcode);}}else{printf("%s\n", gargv[1]);}}
}
四、源码
#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <string>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>using namespace std;const int basesize = 1024;
const int argvnum = 64;
const int envnum = 64;
// 全局的命令行参数表
char *gargv[argvnum];
int gargc = 0;// 全局的变量
int lastcode = 0;// 我的系统的环境变量
char *genv[envnum];// 全局的当前shell工作路径
char pwd[basesize];
char pwdenv[basesize];string GetUserName()
{string name = getenv("USER");return name.empty() ? "None" : name;
}string GetHostName()
{string hostname = getenv("HOSTNAME");return hostname.empty() ? "None" : hostname;
}string GetPwd()
{if(nullptr == getcwd(pwd, sizeof(pwd))) return "None";snprintf(pwdenv, sizeof(pwdenv),"PWD=%s", pwd);putenv(pwdenv); return pwd;
}string LastDir()
{string curr = GetPwd();if(curr == "/" || curr == "None") return curr;size_t pos = curr.rfind("/");if(pos == std::string::npos) return curr;return curr.substr(pos+1);
}string MakeCommandLine()
{char command_line[basesize];snprintf(command_line, basesize, "[%s@%s %s]# ",GetUserName().c_str(), GetHostName().c_str(), LastDir().c_str());return command_line;
}void PrintCommandLine()
{printf("%s", MakeCommandLine().c_str());fflush(stdout);
}bool GetCommandLine(char command_buffer[], int size)
{char *result = fgets(command_buffer, size, stdin);if(!result){return false;}command_buffer[strlen(command_buffer)-1] = 0;if(strlen(command_buffer) == 0) return false;return true;
}void ParseCommandLine(char command_buffer[], int len)
{(void)len;memset(gargv, 0, sizeof(gargv));gargc = 0;const char *sep = " ";gargv[gargc++] = strtok(command_buffer, sep);while((bool)(gargv[gargc++] = strtok(nullptr, sep)));gargc--;
}
bool ExecuteCommand()
{// 让子进程进行执行pid_t id = fork();if(id < 0) return false;if(id == 0){//子进程// 1. 执行命令execvpe(gargv[0], gargv, genv);// 2. 退出exit(1);}int status = 0;pid_t rid = waitpid(id, &status, 0);if(rid > 0){if(WIFEXITED(status)){lastcode = WEXITSTATUS(status);}else{lastcode = 100;}return true;}return false;
}
void AddEnv(const char *item)
{int index = 0;while(genv[index]){index++;}genv[index] = (char*)malloc(strlen(item)+1);strncpy(genv[index], item, strlen(item)+1);genv[++index] = nullptr;
}
// shell自己执行命令,本质是shell调用自己的函数
bool CheckAndExecBuiltCommand()
{if(strcmp(gargv[0], "cd") == 0){// 内建命令if(gargc == 2){chdir(gargv[1]);lastcode = 0;}else{lastcode = 1;}return true;}else if(strcmp(gargv[0], "export") == 0){// export也是内建命令if(gargc == 2){AddEnv(gargv[1]);lastcode = 0;}else{lastcode = 2;}return true;}else if(strcmp(gargv[0], "env") == 0){for(int i = 0; genv[i]; i++){printf("%s\n", genv[i]);}lastcode = 0;return true;}else if(strcmp(gargv[0], "echo") == 0){if(gargc == 2){// echo $?// echo $PATH// echo helloif(gargv[1][0] == '$'){if(gargv[1][1] == '?'){printf("%d\n", lastcode);lastcode = 0;}}else{printf("%s\n", gargv[1]);lastcode = 0;}}else{lastcode = 3;}return true;}return false;
}// 作为一个shell,获取环境变量应该从系统的配置来
// 我们今天就直接从父shell中获取环境变量
void InitEnv()
{extern char **environ;int index = 0;while(environ[index]){genv[index] = (char*)malloc(strlen(environ[index])+1);strncpy(genv[index], environ[index], strlen(environ[index])+1);index++;}genv[index] = nullptr;
}int main()
{InitEnv();char command_buffer[basesize];while(true){PrintCommandLine(); // 1. 命令行提示符if( !GetCommandLine(command_buffer, basesize) ) // 2. 获取用户命令{continue;}ParseCommandLine(command_buffer, strlen(command_buffer)); // 3. 分析命令if ( CheckAndExecBuiltCommand() ){continue;}ExecuteCommand(); // 4. 执行命令}return 0;
}