我是map-reduce的新手。我想知道当我们在hadoop中实现自定义数据类型时,readfields和write方法的用途是什么?例如,
public class Point3D implements Writable {
public float x;
public float y;
public float z;
public Point3D(float x, float y, float z) {
this.x = x;
this.y = y;
this.z = z;
}
public Point3D() {
this(0.0f, 0.0f, 0.0f);
}
public void write(DataOutput out) throws IOException {
out.writeFloat(x);
out.writeFloat(y);
out.writeFloat(z);
}
public void readFields(DataInput in) throws IOException {
x = in.readFloat();
y = in.readFloat();
z = in.readFloat();
}
public String toString() {
return Float.toString(x) + ", "
+ Float.toString(y) + ", "
+ Float.toString(z);
}
public void set(float x, float y, float z)
{
this.x=x;
this.y=y;
this.z=z;
}
}
在上面的例子中,自定义记录器使用set方法来设置x、y和z的值。因此,我们最终在映射器中获得这些值。但是为什么需要readfeals和write()方法呢?请帮助。
readfields()和write()方法用于读取和写入序列化的数据,以便在网络上传输。
下面的问题解释了可写文件的必要性。
在Hadoop MapReduce中为Java类型提供可写包装器类的原因是什么?