本文介绍了 Java 处理文件与目录的方式。
1. 文件和目录路径
Path
对象代表的是一个文件或目录的路径,它是在不同的操作系统和文件系统之上的抽象。它的目的是,在构建路径时,我们不必注意底层的操作系统,我们的代码不需要重写就能在不同的操作系统上工作。
java.nio.file.Paths
类包含了重载的 static get()
方法,可以接受一个 String
序列,或一个统一资源标识符(Uniform Resource Identifier,URI),然后将其转化为一个 Path
对象:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83
| package file;
import java.net.URI; import java.nio.file.Files; import java.nio.file.Path; import java.nio.file.Paths;
public class PathInfo { static void showInfo(Path p) { System.out.println("--------------------"); System.out.println("toString(): " + p); System.out.println("exists(): " + Files.exists(p)); System.out.println("isRegularFile(): " + Files.isRegularFile(p)); System.out.println("isDirectory(): " + Files.isDirectory(p)); System.out.println("isAbsolute(): " + p.isAbsolute()); System.out.println("getFileName(): " + p.getFileName()); System.out.println("getParent(): " + p.getParent()); System.out.println("getRoot(): " + p.getRoot()); }
public static void main(String[] args) { System.out.println(System.getProperty("os.name"));
Path filePath = Paths.get("src/file/test.txt"); showInfo(filePath); showInfo(filePath.toAbsolutePath());
Path dirPath = Paths.get("src", "file"); showInfo(dirPath);
Path invalidPath = Paths.get("src", "file", "invalid.txt"); showInfo(invalidPath);
System.out.println("--------------------"); URI fileURI = filePath.toUri(); System.out.println("URI: " + fileURI); Path fileFromURI = Paths.get(fileURI); System.out.println("Files.exists(fileFromURI): " + Files.exists(fileFromURI));
} }
|
虽然 toString()
生成的是路径的完整表示,但是可以看到 getFileName()
总是会生成文件的名字。使用 Files
工具类(后面会看到更多),我们可以测试文件是否存在,是否为“普通”文件,是否为目录等等。
在这里,我们看到了文件的 URI 是什么样子的,但 URI 可以用来描述大多数事物,不仅限于文件,然后我们成功地将 URI 转回到了一个 Path
之中。
1.1 获取Path的片段
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
| package file;
import java.nio.file.Path; import java.nio.file.Paths;
public class PartsOfPaths { public static void main(String[] args) { Path p = Paths.get("src/file/test.txt").toAbsolutePath(); System.out.println("Path: " + p);
System.out.println("endsWith(.txt): " + p.endsWith(".txt"));
for (int i = 0; i < p.getNameCount(); i++) System.out.print(p.getName(i) + (i == p.getNameCount() - 1 ? "" : "/")); System.out.println();
for (Path pName: p) { System.out.println("p.startsWith(" + pName + "): " + p.startsWith(pName)); System.out.println("p.endsWith(" + pName + "): " + p.endsWith(pName)); }
System.out.println("p.startsWith(" + p.getRoot() + "): " + p.startsWith(p.getRoot()));
} }
|
在 getNameCount()
界定的上限之内,我们可以结合索引使用 getName()
,得到一个 Path
的各个部分。Path
也可以生成 Iterator
,所以我们也可以使用 for-in
来遍历。
注意,尽管这里的路径确实是以 .txt
结尾的,但 endsWith()
的结果是 false
。这是因为该方法比较的是整个路径组件(即用 /
分开的每个整体部分,如 test.txt
),而不是名字中的一个字串。
还可以看到我们在对 Path
进行遍历时,并没有包含根目录,只有当我们用根目录来检查 startsWith()
时才会得到 true
。
1.2 获取Path信息
Files
工具类中包含了一整套用于检查 Path
的各种信息的方法:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44
| package file;
import java.io.IOException; import java.nio.file.Files; import java.nio.file.Path; import java.nio.file.Paths;
public class PathAnalysis { public static void main(String[] args) throws IOException { Path p = Paths.get("src/file/test.txt").toAbsolutePath();
System.out.println("exists(): " + Files.exists(p)); System.out.println("isDirectory(): " + Files.isDirectory(p)); System.out.println("isExecutable(): " + Files.isExecutable(p)); System.out.println("isReadable(): " + Files.isReadable(p)); System.out.println("isRegularFile(): " + Files.isRegularFile(p)); System.out.println("isWritable(): " + Files.isWritable(p)); System.out.println("notExists(): " + Files.notExists(p));
System.out.println("isHidden(): " + Files.isHidden(p)); System.out.println("size(): " + Files.size(p)); System.out.println("getFileStore(): " + Files.getFileStore(p)); System.out.println("getLastModifiedTime(): " + Files.getLastModifiedTime(p)); System.out.println("getOwner(): " + Files.getOwner(p)); System.out.println("probeContentType(): " + Files.probeContentType(p));
} }
|
1.3 添加或删除路径片段
我们必须能够通过对自己的 Path
对象添加和删除某些路径片段来构建 Path
对象。若想去掉某个基准路径可以使用 relativize()
,想在一个 Path
对象的后面添加路径片段可以使用 resolve()
:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
| package file;
import java.io.IOException; import java.nio.file.Path; import java.nio.file.Paths;
public class AddAndSubPaths { public static void main(String[] args) throws IOException { Path base = Paths.get("src").toAbsolutePath(); System.out.println("base: " + base);
Path filePath = Paths.get("src/file/test.txt").toAbsolutePath(); System.out.println("filePath: " + filePath);
Path filePathWithoutBase = base.relativize(filePath); System.out.println("filePathWithoutBase: " + filePathWithoutBase);
Path filePathWithBase = base.resolve("file/test.txt"); System.out.println("filePathWithBase: " + filePathWithBase);
Path workspacePath = Paths.get(""); System.out.println("workspacePath: " + workspacePath); System.out.println("workspacePath.toRealPath(): " + workspacePath.toRealPath());
} }
|
只有 Path
为绝对路径时,才能将其用作 relativize()
方法的参数。此外还增加了对 toRealPath()
的进一步测试,除了路径不存在的情况下会抛出 IOException
异常,它总是会对 Path
进行扩展和规范化。
2. 文件系统
为了完整起见,我们需要一种方式来找出文件系统的其他信息。在这里,我们可以使用静态的 FileSystems
工具来获得默认的文件系统,也可以在一个 Path
对象上调用 getFileSystem()
来获得创建这个路径对象的文件系统。我们可以通过给定的 URI 获得一个文件系统,也可以构建一个新的文件系统(如果操作系统支持的话)。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
| package file;
import java.nio.file.FileStore; import java.nio.file.FileSystem; import java.nio.file.FileSystems; import java.nio.file.Path;
public class FileSystemDemo { public static void main(String[] args) { FileSystem fs = FileSystems.getDefault();
for (FileStore s: fs.getFileStores()) System.out.println("File Store: " + s);
for (Path p: fs.getRootDirectories()) System.out.println("Root Directory: " + p);
System.out.println("Separator: " + fs.getSeparator()); System.out.println("isOpen: " + fs.isOpen()); System.out.println("isReadOnly: " + fs.isReadOnly()); System.out.println("File Attribute Views: " + fs.supportedFileAttributeViews());
} }
|
3. 查找文件
java.nio.file
中有一个用于查找文件的类 PathMatcher
,可以通过在 FileSystem
对象上调用 getPathMatcher()
来获得一个 PathMatcher
对象,并传入我们感兴趣的查找模式。模式有两个选项:glob
和 regex
。glob
更简单,但实际上非常强大,可以解决很多问题,如果问题更为复杂,可以使用 regex
。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
| package file;
import java.io.IOException; import java.nio.file.*;
public class FindFiles { public static void main(String[] args) throws IOException { Path filePath = Paths.get("src/file"); PathMatcher matcher1 = FileSystems.getDefault().getPathMatcher("glob:**/*.{txt,tmp}"); Files.walk(filePath) .filter(matcher1::matches) .forEach(System.out::println); System.out.println("--------------------");
PathMatcher matcher2 = FileSystems.getDefault().getPathMatcher("glob:*.txt"); Files.walk(filePath) .map(Path::getFileName) .filter(matcher2::matches) .forEach(System.out::println);
} }
|
在 matcher1
中,glob
表达式开头的 **/
表示所有子目录,如果你想匹配的不仅仅是以基准目录为结尾的 Path
,那么它是必不可少的,因为它匹配的是完整路径,直到找到想要的结果。单个的 *
表示任何东西,后面的花括号表示的是一系列的可能性,即查找任何以 .txt
或 .tmp
结尾的东西。
注意在 matcher2
中我们只匹配 *.txt
,而我们的 filePath
并不在基准目录下,因此需要先用 map()
将文件的完整路径改为只剩最后一段 Path
片段,即 xxx.txt
这种形式,这样才能匹配上。
4. 读写文件
目前为止,我们可以做的只是对路径和目录的操作,现在来看看如何操作文件本身的内容。
java.nio.file.Files
类包含了方便读写文本文件和二进制文件的工具函数。Files.readAllLines()
可以一次性读入整个文件,生成一个 List<String>
:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
| package file;
import java.io.IOException; import java.nio.file.Files; import java.nio.file.Path; import java.nio.file.Paths; import java.util.List;
public class ReadAllLines { public static void main(String[] args) throws IOException { Path p = Paths.get("src/file/test.txt"); List<String> lines = Files.readAllLines(p); for (String line: lines) System.out.println(line); System.out.println("--------------------");
Files.readAllLines(p) .stream() .map(line -> line.substring(0, line.length() / 2)) .forEach(System.out::println);
} }
|
Files.write()
也被重载了,可以将 byte
数组或任何实现了 Iterable
接口的类的对象写入文件:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44
| package file;
import java.io.IOException; import java.nio.file.Files; import java.nio.file.Path; import java.nio.file.Paths; import java.util.ArrayList; import java.util.Arrays; import java.util.List; import java.util.Random;
public class FilesWrite { static Random rand = new Random(47);
public static void main(String[] args) throws IOException { byte[] bytes = new byte[10]; rand.nextBytes(bytes);
Path bytesPath = Paths.get("src/file/bytes.txt"); Files.write(bytesPath, bytes);
for (byte b: Files.readAllBytes(bytesPath)) System.out.print(b + " "); System.out.println(); System.out.println("The size of bytes.txt: " + Files.size(bytesPath));
List<String> contents = new ArrayList<>(Arrays.asList("Hello world", "Hello java", "Hello AsanoSaki"));
Path filePath = Paths.get("src/file/contents.txt"); Files.write(filePath, contents);
Files.readAllLines(filePath).stream().forEach(System.out::println); System.out.println("The size of contents.txt: " + Files.size(filePath));
} }
|
现在我们读取文件时都是将文件全部一次性读入,这可能会有以下的问题:
- 这个文件非常大,如果一次性读取整个文件,可能会耗尽内存。
- 我们只需要文件的一部分就能得到想要的结果,所以读取整个文件是在浪费时间。
Files.lines()
可以很方便地将一个文件变为一个由行组成的 Stream
:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
| package file;
import java.io.IOException; import java.nio.file.Files; import java.nio.file.Paths;
public class ReadLineStream { public static void main(String[] args) throws IOException { Files.lines(Paths.get("src/file/contents.txt")) .skip(1) .map(String::toUpperCase) .forEach(System.out::println);
} }
|
如果把文件当作一个由行组成的输入流来处理,那么 Files.lines()
非常有用,但是如果我们想在一个流中完成读取、处理和写入,那该怎么办呢?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| package file;
import java.io.IOException; import java.io.PrintWriter; import java.nio.file.Files; import java.nio.file.Paths; import java.util.stream.Stream;
public class StreamInAndOut { public static void main(String[] args) { try (Stream<String> in = Files.lines(Paths.get("src/file/contents.txt")); PrintWriter out = new PrintWriter("src/file/uppercaseContents.txt")) { in.map(String::toUpperCase).forEachOrdered(out::println); } catch (IOException e) { System.out.println("Caught IOException"); } } }
|
因为我们是在同一个块中执行的所有操作,所以两个文件可以在相同的 try-with-resources
块中打开。PrintWriter
是一个旧式的 java.io
类,允许我们“打印”到—个文件,所以它是这个应用的理想选择。