我有这样的序列A C T G--C A G TG-C A并且我存储在一个文本文件中。如果文件中有-,我想赋值0并显示0而不是i对于G、A、T、C至1、2、3、4 也是如此
import java.io.*;
public class file
{
public static void main(String args[]) throws Exception
{
FileReader fr=new FileReader("TESTDATA_HPV_34_1.txt");
BufferedReader br=new BufferedReader(fr);
String s;
while((s=br.readLine())!=null)
{
System.out.println(s);
}
}
}
您可以使用String的replace()
实例方法。
String newString = s.replace("-", "0");
你也可以把它们串在一起。
newString = s.replace("G","1").replace("A","2").replace("T","3").replace("C","4");
replace
返回一个带有替换项的新字符串,因为string是一个不可变的类。
如果您的测试数据非常大(我的意思是非常非常大),那么编写您自己的替换方法可能是值得的,该方法只在字符串中循环一次并替换每个字符。测试一下,看看只使用几个替换是否存在性能问题。
您可以按如下方式设置地图:
Map<Character, Integer> map = new HashMap<Character, Integer>(5);
map.put('-', 0);
map.put('G', 1);
map.put('A', 2);
map.put('T', 3);
map.put('C', 4);
现在,你可以做一些类似的事情:
String dna = "A C T G - - C A G T G - - C A";
StringBuilder result = new StringBuilder(dna.length());
for (int i = 0; i < dna.length(); i++) {
char c = dna.charAt(i);
if (map.containsKey(c))
result.append(map.get(c));
else
result.append(c);
}
System.out.println(result);
2 4 3 1 0 0 4 2 1 3 1 0 4 2
readLine为您提供一行字符串
0)创建一个具有键G、a、T、C和值1、2、3、4 的地图
1) 从字符串行获取字符数组
2) 创建变量charVal
3) 遍历字符数组
4) 对于每个字符,将charVal初始化为0,从映射中获取该字符的值,并将其分配给charVal
5) 打印charVal
p.S.:正确关闭资源
正如Sotirios所说,使用Map
将键绑定到相应的值。您可以迭代Map
并将replace()
应用于您拥有的字符串(很抱歉格式不正确):
import java.io.*;
public class file
{
public static void main(String args[]) throws Exception
{
Map<Character, Character> replacements = new HashMap<Character, Character>();
replacements.put('-', '0');
replacements.put('G', '1');
// ....
FileReader fr=new FileReader("TESTDATA_HPV_34_1.txt");
BufferedReader br=new BufferedReader(fr);
String s;
while((s=br.readLine())!=null) {
for ( Map.Entry<Character, Character> entry : replacements.entrySet() ) {
s = s.replace(entry.getKey(), entry.getValue());
}
System.out.println(s);
}
}
}
正如Cemafo所说,如果你关心性能,那么也许你应该使用String.replaceAll()
来同时进行所有替换。