12-I/O

I/O模块
文件模块
路径模块
进程和组长
iodatachardata

本章简单介绍Elixir的输入、输出机制,以及相关的模块,如IO文件路径

现在介绍I/O似乎有点早,但是I/O系统可以让我们一窥Elixir哲学,满足我们对该语言以及VM的好奇心。

12.1-IO模块

IO模块是Elixir语言中读写标准输入、输出、标准错误、文件、设备的主要机制。 使用该模块的方法颇为直接:

iex> IO.puts "hello world"
"hello world"
:ok
iex> IO.gets "yes or no? "
yes or no? yes
"yes\n"

IO模块中的函数默认使用标准输入输出。 我们也可以传递:stderr来指示将错误信息写到标准错误设备上:

iex> IO.puts :stderr, "hello world"
"hello world"
:ok

12.2-文件模块

文件模块包含了可以让我们读写文件的函数。 默认情况下文件是以二进制模式打开,它要求程序员使用特殊的IO.binread/2IO.binwrite/2函数来读写文件:

iex> {:ok, file} = File.open "hello", [:write]
{:ok, #PID<0.47.0>}
iex> IO.binwrite file, "world"
:ok
iex> File.close file
:ok
iex> File.read "hello"
{:ok, "world"}

文件可以使用:utf8编码打开,然后就可以被IO模块中其他函数使用了:

iex> {:ok, file} = File.open "another", [:write, :utf8]
{:ok, #PID<0.48.0>}

除了打开、读写文件的函数,文件模块还有许多函数来操作文件系统。这些函数根据Unix功能相对应的命令命名。 如File.rm/1用来删除文件;File.mkdir/1用来创建目录;File.mkdir_p/1创建目录并保证其父目录一并创建; 还有File.cp_r/2File.rm_rf/2用来递归地复制和删除整个目录。

你还会注意到文件模块中,函数一般有一个名称类似的版本。区别是名称上一个有!(bang)一个没有。 例如,上面的例子我们在读取“hello”文件时,用的是不带!号的版本。 下面用例子演示下它们的区别:

iex> File.read "hello"
{:ok, "world"}
iex> File.read! "hello"
"world"
iex> File.read "unknown"
{:error, :enoent}
iex> File.read! "unknown"
** (File.Error) could not read file unknown: no such file or directory

注意看,当文件不存在时,带!号的版本会报错。就是说不带!号的版本能照顾到模式匹配出来的不同的情况。 但有的时候,你就是希望文件在那儿,!使得它能报出有意义的错误。 因此,不要写:

{:ok, body} = File.read(file)

相反地,应该这么写:

case File.read(file) do
  {:ok, body} -> # handle ok
  {:error, r} -> # handle error
end

或者

File.read!(file)

12.3-路径模块

文件模块中绝大多数函数都以路径作为参数。通常这些路径都是二进制,可以被路径模块提供的函数操作:

iex> Path.join("foo", "bar")
"foo/bar"
iex> Path.expand("~/hello")
"/Users/jose/hello"


有了以上介绍的几个模块和函数,我们已经能对文件系统进行基本的IO操作。 下面将讨论IO令人好奇的高级话题。这部分不是写Elixir程序必须掌握的,可以跳过不看。 但是如果你大概地看看,可以了解一下IO是如何在VM上实现以及其它一些有趣的内容。

12.4-进程和组长

你可能已经发现,File.open/2函数返回了一个包含PID的元祖:

iex> {:ok, file} = File.open "hello", [:write]
{:ok, #PID<0.47.0>}

这是因为IO模块实际上是同进程协同工作的。当你调用IO.write(pid, binary)时,IO模块将发送一条消息给执行操作的进程。 让我们用自己的代码表述下这个过程:

iex> pid = spawn fn ->
...>  receive do: (msg -> IO.inspect msg)
...> end
#PID<0.57.0>
iex> IO.write(pid, "hello")
{:io_request, #PID<0.41.0>, #PID<0.57.0>, {:put_chars, :unicode, "hello"}}
** (ErlangError) erlang error: :terminated

调用IO.write/2之后,可以看见打印出了发给IO模块的请求。然而因为我们没有提供某些东西,这个请求失败了。

StringIO模块提供了一个基于字符串的IO实现:

iex> {:ok, pid} = StringIO.open("hello")
{:ok, #PID<0.43.0>}
iex> IO.read(pid, 2)
"he"

Erlang虚拟机用进程给IO设备建模,允许同一个网络中的不同节点通过交换文件进程,实现节点间的文件读写。 在所有IO设备之中,有一个特殊的进程,称作组长(group leader)。

当你写东西到标准输出,实际上是发送了一条消息给组长,它把内容写给STDIO文件表述者

iex> IO.puts :stdio, "hello"
hello
:ok
iex> IO.puts Process.group_leader, "hello"
hello
:ok

组长可为每个进程做相应配置,用于处理不同的情况。 例如,当在远程终端执行代码时,它能保证远程机器的消息可以被重定向到发起操作的终端上。

12.5-iodatachardata

在以上所有例子中,我们都用的是二进制/字符串方式读写文件。 在“二进制、字符串和字符列表”那章里,我们注意到字符串就是普通的bytes,而字符列表是code points的列表。

IO模块和文件模块中的函数接受列表作为参数。这也就算了,其实还可以接受混合类型的列表,里面是整形、二进制都行:

iex> IO.puts 'hello world'
hello world
:ok
iex> IO.puts ['hello', ?\s, "world"]
hello world
:ok

尽管如此,有些地方还是要注意。一个列表可能表示一串byte,或者一串字符。用哪一种看IO设备是怎么编码的。 如果不指明编码,文件就以raw模式打开,这时候只能用文件模块里bin开头(二进制版)的函数对其进行操作。 这些函数接受iodata*作为参数,即,它们期待一个整数值的列表,用来表示byte或二进制。

尽管只是细微的差别,但你只需要考虑那些细节,如果你打算传递列表给那些函数。 底层的bytes已经可以表示二进制,这种表示就是raw的。