Whamcloud - gitweb
LU-9771 flr: Send write intent RPC to mdt
[fs/lustre-release.git] / lustre / llite / vvp_object.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2008, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2012, 2015, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * cl_object implementation for VVP layer.
33  *
34  *   Author: Nikita Danilov <nikita.danilov@sun.com>
35  */
36
37 #define DEBUG_SUBSYSTEM S_LLITE
38
39 #include <linux/user_namespace.h>
40 #ifdef HAVE_UIDGID_HEADER
41 # include <linux/uidgid.h>
42 #endif
43 #include <libcfs/libcfs.h>
44
45 #include <obd.h>
46 #include "llite_internal.h"
47 #include "vvp_internal.h"
48
49 /*****************************************************************************
50  *
51  * Object operations.
52  *
53  */
54
55 int vvp_object_invariant(const struct cl_object *obj)
56 {
57         struct inode            *inode  = vvp_object_inode(obj);
58         struct ll_inode_info    *lli    = ll_i2info(inode);
59
60         return (S_ISREG(inode->i_mode) || inode->i_mode == 0) &&
61                lli->lli_clob == obj;
62 }
63
64 static int vvp_object_print(const struct lu_env *env, void *cookie,
65                             lu_printer_t p, const struct lu_object *o)
66 {
67         struct vvp_object    *obj   = lu2vvp(o);
68         struct inode         *inode = obj->vob_inode;
69         struct ll_inode_info *lli;
70
71         (*p)(env, cookie, "(%d %d) inode: %p ",
72              atomic_read(&obj->vob_transient_pages),
73              atomic_read(&obj->vob_mmap_cnt),
74              inode);
75         if (inode) {
76                 lli = ll_i2info(inode);
77                 (*p)(env, cookie, "%lu/%u %o %u %d %p "DFID,
78                      inode->i_ino, inode->i_generation, inode->i_mode,
79                      inode->i_nlink, atomic_read(&inode->i_count),
80                      lli->lli_clob, PFID(&lli->lli_fid));
81         }
82         return 0;
83 }
84
85 static int vvp_attr_get(const struct lu_env *env, struct cl_object *obj,
86                         struct cl_attr *attr)
87 {
88         struct inode *inode = vvp_object_inode(obj);
89
90         /*
91          * lov overwrites most of these fields in
92          * lov_attr_get()->...lov_merge_lvb_kms(), except when inode
93          * attributes are newer.
94          */
95
96         attr->cat_size = i_size_read(inode);
97         attr->cat_mtime = inode->i_mtime.tv_sec;
98         attr->cat_atime = inode->i_atime.tv_sec;
99         attr->cat_ctime = inode->i_ctime.tv_sec;
100         attr->cat_blocks = inode->i_blocks;
101         attr->cat_uid = from_kuid(&init_user_ns, inode->i_uid);
102         attr->cat_gid = from_kgid(&init_user_ns, inode->i_gid);
103         attr->cat_projid = ll_i2info(inode)->lli_projid;
104         /* KMS is not known by this layer */
105         return 0; /* layers below have to fill in the rest */
106 }
107
108 static int vvp_attr_update(const struct lu_env *env, struct cl_object *obj,
109                            const struct cl_attr *attr, unsigned valid)
110 {
111         struct inode *inode = vvp_object_inode(obj);
112
113         if (valid & CAT_UID)
114                 inode->i_uid = make_kuid(&init_user_ns, attr->cat_uid);
115         if (valid & CAT_GID)
116                 inode->i_gid = make_kgid(&init_user_ns, attr->cat_gid);
117         if (valid & CAT_ATIME)
118                 inode->i_atime.tv_sec = attr->cat_atime;
119         if (valid & CAT_MTIME)
120                 inode->i_mtime.tv_sec = attr->cat_mtime;
121         if (valid & CAT_CTIME)
122                 inode->i_ctime.tv_sec = attr->cat_ctime;
123         if (0 && valid & CAT_SIZE)
124                 i_size_write(inode, attr->cat_size);
125         if (valid & CAT_PROJID)
126                 ll_i2info(inode)->lli_projid = attr->cat_projid;
127         /* not currently necessary */
128         if (0 && valid & (CAT_UID|CAT_GID|CAT_SIZE|CAT_PROJID))
129                 mark_inode_dirty(inode);
130         return 0;
131 }
132
133 static int vvp_conf_set(const struct lu_env *env, struct cl_object *obj,
134                         const struct cl_object_conf *conf)
135 {
136         struct ll_inode_info *lli = ll_i2info(conf->coc_inode);
137
138         if (conf->coc_opc == OBJECT_CONF_INVALIDATE) {
139                 CDEBUG(D_VFSTRACE, DFID ": losing layout lock\n",
140                        PFID(&lli->lli_fid));
141
142                 ll_layout_version_set(lli, CL_LAYOUT_GEN_NONE);
143
144                 /* Clean up page mmap for this inode.
145                  * The reason for us to do this is that if the page has
146                  * already been installed into memory space, the process
147                  * can access it without interacting with lustre, so this
148                  * page may be stale due to layout change, and the process
149                  * will never be notified.
150                  * This operation is expensive but mmap processes have to pay
151                  * a price themselves. */
152                 unmap_mapping_range(conf->coc_inode->i_mapping,
153                                     0, OBD_OBJECT_EOF, 0);
154         }
155         return 0;
156 }
157
158 static int vvp_prune(const struct lu_env *env, struct cl_object *obj)
159 {
160         struct inode *inode = vvp_object_inode(obj);
161         int rc;
162         ENTRY;
163
164         rc = cl_sync_file_range(inode, 0, OBD_OBJECT_EOF, CL_FSYNC_LOCAL, 1);
165         if (rc < 0) {
166                 CDEBUG(D_VFSTRACE, DFID ": writeback failed: %d\n",
167                        PFID(lu_object_fid(&obj->co_lu)), rc);
168                 RETURN(rc);
169         }
170
171         truncate_inode_pages(inode->i_mapping, 0);
172         if (inode->i_mapping->nrpages) {
173                 CDEBUG(D_VFSTRACE, DFID ": still has %lu pages remaining\n",
174                        PFID(lu_object_fid(&obj->co_lu)),
175                        inode->i_mapping->nrpages);
176                 RETURN(-EIO);
177         }
178
179         RETURN(0);
180 }
181
182 static int vvp_object_glimpse(const struct lu_env *env,
183                               const struct cl_object *obj, struct ost_lvb *lvb)
184 {
185         struct inode *inode = vvp_object_inode(obj);
186
187         ENTRY;
188         lvb->lvb_mtime = LTIME_S(inode->i_mtime);
189         lvb->lvb_atime = LTIME_S(inode->i_atime);
190         lvb->lvb_ctime = LTIME_S(inode->i_ctime);
191
192         /*
193          * LU-417: Add dirty pages block count lest i_blocks reports 0, some
194          * "cp" or "tar" on remote node may think it's a completely sparse file
195          * and skip it.
196          */
197         if (lvb->lvb_size > 0 && lvb->lvb_blocks == 0)
198                 lvb->lvb_blocks = dirty_cnt(inode);
199
200         RETURN(0);
201 }
202
203 static void vvp_req_attr_set(const struct lu_env *env, struct cl_object *obj,
204                              struct cl_req_attr *attr)
205 {
206         struct inode *inode;
207         struct obdo  *oa;
208         u64 valid_flags = OBD_MD_FLTYPE;
209
210         oa = attr->cra_oa;
211         inode = vvp_object_inode(obj);
212
213         if (attr->cra_type == CRT_WRITE) {
214                 valid_flags |= OBD_MD_FLMTIME | OBD_MD_FLCTIME |
215                                OBD_MD_FLUID | OBD_MD_FLGID;
216                 obdo_set_o_projid(oa, ll_i2info(inode)->lli_projid);
217         }
218         obdo_from_inode(oa, inode, valid_flags & attr->cra_flags);
219         obdo_set_parent_fid(oa, &ll_i2info(inode)->lli_fid);
220         if (OBD_FAIL_CHECK(OBD_FAIL_LFSCK_INVALID_PFID))
221                 oa->o_parent_oid++;
222         memcpy(attr->cra_jobid, ll_i2info(inode)->lli_jobid, LUSTRE_JOBID_SIZE);
223 }
224
225 static const struct cl_object_operations vvp_ops = {
226         .coo_page_init    = vvp_page_init,
227         .coo_lock_init    = vvp_lock_init,
228         .coo_io_init      = vvp_io_init,
229         .coo_attr_get     = vvp_attr_get,
230         .coo_attr_update  = vvp_attr_update,
231         .coo_conf_set     = vvp_conf_set,
232         .coo_prune        = vvp_prune,
233         .coo_glimpse      = vvp_object_glimpse,
234         .coo_req_attr_set = vvp_req_attr_set
235 };
236
237 static int vvp_object_init0(const struct lu_env *env,
238                             struct vvp_object *vob,
239                             const struct cl_object_conf *conf)
240 {
241         vob->vob_inode = conf->coc_inode;
242         atomic_set(&vob->vob_transient_pages, 0);
243         cl_object_page_init(&vob->vob_cl, sizeof(struct vvp_page));
244         return 0;
245 }
246
247 static int vvp_object_init(const struct lu_env *env, struct lu_object *obj,
248                            const struct lu_object_conf *conf)
249 {
250         struct vvp_device *dev = lu2vvp_dev(obj->lo_dev);
251         struct vvp_object *vob = lu2vvp(obj);
252         struct lu_object  *below;
253         struct lu_device  *under;
254         int result;
255
256         under = &dev->vdv_next->cd_lu_dev;
257         below = under->ld_ops->ldo_object_alloc(env, obj->lo_header, under);
258         if (below != NULL) {
259                 const struct cl_object_conf *cconf;
260
261                 cconf = lu2cl_conf(conf);
262                 lu_object_add(obj, below);
263                 result = vvp_object_init0(env, vob, cconf);
264         } else
265                 result = -ENOMEM;
266
267         return result;
268 }
269
270 static void vvp_object_free(const struct lu_env *env, struct lu_object *obj)
271 {
272         struct vvp_object *vob = lu2vvp(obj);
273
274         lu_object_fini(obj);
275         lu_object_header_fini(obj->lo_header);
276         OBD_SLAB_FREE_PTR(vob, vvp_object_kmem);
277 }
278
279 static const struct lu_object_operations vvp_lu_obj_ops = {
280         .loo_object_init        = vvp_object_init,
281         .loo_object_free        = vvp_object_free,
282         .loo_object_print       = vvp_object_print,
283 };
284
285 struct vvp_object *cl_inode2vvp(struct inode *inode)
286 {
287         struct ll_inode_info *lli = ll_i2info(inode);
288         struct cl_object     *obj = lli->lli_clob;
289         struct lu_object     *lu;
290
291         LASSERT(obj != NULL);
292         lu = lu_object_locate(obj->co_lu.lo_header, &vvp_device_type);
293         LASSERT(lu != NULL);
294
295         return lu2vvp(lu);
296 }
297
298 struct lu_object *vvp_object_alloc(const struct lu_env *env,
299                                    const struct lu_object_header *unused,
300                                    struct lu_device *dev)
301 {
302         struct vvp_object *vob;
303         struct lu_object  *obj;
304
305         OBD_SLAB_ALLOC_PTR_GFP(vob, vvp_object_kmem, GFP_NOFS);
306         if (vob != NULL) {
307                 struct cl_object_header *hdr;
308
309                 obj = &vob->vob_cl.co_lu;
310                 hdr = &vob->vob_header;
311                 cl_object_header_init(hdr);
312                 hdr->coh_page_bufsize = cfs_size_round(sizeof(struct cl_page));
313
314                 lu_object_init(obj, &hdr->coh_lu, dev);
315                 lu_object_add_top(&hdr->coh_lu, obj);
316
317                 vob->vob_cl.co_ops = &vvp_ops;
318                 obj->lo_ops = &vvp_lu_obj_ops;
319         } else
320                 obj = NULL;
321         return obj;
322 }