Whamcloud - gitweb
LU-15535 llite: deadlock on lli_lsm_sem
[fs/lustre-release.git] / lustre / llite / vvp_object.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2008, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2012, 2017, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  *
31  * cl_object implementation for VVP layer.
32  *
33  *   Author: Nikita Danilov <nikita.danilov@sun.com>
34  */
35
36 #define DEBUG_SUBSYSTEM S_LLITE
37
38 #include <linux/user_namespace.h>
39 #include <linux/uidgid.h>
40
41 #include <libcfs/libcfs.h>
42
43 #include <obd.h>
44 #include "llite_internal.h"
45 #include "vvp_internal.h"
46
47 /*****************************************************************************
48  *
49  * Object operations.
50  *
51  */
52
53 int vvp_object_invariant(const struct cl_object *obj)
54 {
55         struct inode            *inode  = vvp_object_inode(obj);
56         struct ll_inode_info    *lli    = ll_i2info(inode);
57
58         return (S_ISREG(inode->i_mode) || inode->i_mode == 0) &&
59                lli->lli_clob == obj;
60 }
61
62 static int vvp_object_print(const struct lu_env *env, void *cookie,
63                             lu_printer_t p, const struct lu_object *o)
64 {
65         struct vvp_object    *obj   = lu2vvp(o);
66         struct inode         *inode = obj->vob_inode;
67         struct ll_inode_info *lli;
68
69         (*p)(env, cookie, "(%d) inode: %p ",
70              atomic_read(&obj->vob_mmap_cnt),
71              inode);
72         if (inode) {
73                 lli = ll_i2info(inode);
74                 (*p)(env, cookie, "%lu/%u %o %u %d %p "DFID,
75                      inode->i_ino, inode->i_generation, inode->i_mode,
76                      inode->i_nlink, atomic_read(&inode->i_count),
77                      lli->lli_clob, PFID(&lli->lli_fid));
78         }
79         return 0;
80 }
81
82 static int vvp_attr_get(const struct lu_env *env, struct cl_object *obj,
83                         struct cl_attr *attr)
84 {
85         struct inode *inode = vvp_object_inode(obj);
86
87         /*
88          * lov overwrites most of these fields in
89          * lov_attr_get()->...lov_merge_lvb_kms(), except when inode
90          * attributes are newer.
91          */
92
93         attr->cat_size = i_size_read(inode);
94         attr->cat_mtime = inode->i_mtime.tv_sec;
95         attr->cat_atime = inode->i_atime.tv_sec;
96         attr->cat_ctime = inode->i_ctime.tv_sec;
97         attr->cat_blocks = inode->i_blocks;
98         attr->cat_uid = from_kuid(&init_user_ns, inode->i_uid);
99         attr->cat_gid = from_kgid(&init_user_ns, inode->i_gid);
100         attr->cat_projid = ll_i2info(inode)->lli_projid;
101         /* KMS is not known by this layer */
102         return 0; /* layers below have to fill in the rest */
103 }
104
105 static int vvp_attr_update(const struct lu_env *env, struct cl_object *obj,
106                            const struct cl_attr *attr, unsigned valid)
107 {
108         struct inode *inode = vvp_object_inode(obj);
109
110         if (valid & CAT_UID)
111                 inode->i_uid = make_kuid(&init_user_ns, attr->cat_uid);
112         if (valid & CAT_GID)
113                 inode->i_gid = make_kgid(&init_user_ns, attr->cat_gid);
114         if (valid & CAT_ATIME)
115                 inode->i_atime.tv_sec = attr->cat_atime;
116         if (valid & CAT_MTIME)
117                 inode->i_mtime.tv_sec = attr->cat_mtime;
118         if (valid & CAT_CTIME)
119                 inode->i_ctime.tv_sec = attr->cat_ctime;
120         if (0 && valid & CAT_SIZE)
121                 i_size_write(inode, attr->cat_size);
122         if (valid & CAT_PROJID)
123                 ll_i2info(inode)->lli_projid = attr->cat_projid;
124         /* not currently necessary */
125         if (0 && valid & (CAT_UID|CAT_GID|CAT_SIZE|CAT_PROJID))
126                 mark_inode_dirty(inode);
127         return 0;
128 }
129
130 static int vvp_conf_set(const struct lu_env *env, struct cl_object *obj,
131                         const struct cl_object_conf *conf)
132 {
133         struct ll_inode_info *lli = ll_i2info(conf->coc_inode);
134
135         if (conf->coc_opc == OBJECT_CONF_INVALIDATE) {
136                 CDEBUG(D_VFSTRACE, DFID ": losing layout lock\n",
137                        PFID(&lli->lli_fid));
138
139                 ll_layout_version_set(lli, CL_LAYOUT_GEN_NONE);
140
141                 /* Clean up page mmap for this inode.
142                  * The reason for us to do this is that if the page has
143                  * already been installed into memory space, the process
144                  * can access it without interacting with lustre, so this
145                  * page may be stale due to layout change, and the process
146                  * will never be notified.
147                  * This operation is expensive but mmap processes have to pay
148                  * a price themselves. */
149                 unmap_mapping_range(conf->coc_inode->i_mapping,
150                                     0, OBD_OBJECT_EOF, 0);
151                 pcc_layout_invalidate(conf->coc_inode);
152         }
153         return 0;
154 }
155
156 static int vvp_prune(const struct lu_env *env, struct cl_object *obj)
157 {
158         struct inode *inode = vvp_object_inode(obj);
159         int rc;
160         ENTRY;
161
162         rc = cl_sync_file_range(inode, 0, OBD_OBJECT_EOF, CL_FSYNC_LOCAL, 1);
163         if (rc < 0) {
164                 CDEBUG(D_VFSTRACE, DFID ": writeback failed: %d\n",
165                        PFID(lu_object_fid(&obj->co_lu)), rc);
166                 RETURN(rc);
167         }
168
169         if (ll_get_inode_lock_owner(inode) != current)
170                 /* ask LOV get inode lock then lo_type_guard */
171                 RETURN(-EAGAIN);
172
173         LASSERTF(inode_is_locked(inode), DFID ":inode %p lli_flags %#lx\n",
174                  PFID(lu_object_fid(&obj->co_lu)), inode,
175                  ll_i2info(inode)->lli_flags);
176
177         ll_truncate_inode_pages_final(inode);
178         mapping_clear_exiting(inode->i_mapping);
179
180         RETURN(0);
181 }
182
183 static int vvp_object_glimpse(const struct lu_env *env,
184                               const struct cl_object *obj, struct ost_lvb *lvb)
185 {
186         struct inode *inode = vvp_object_inode(obj);
187
188         ENTRY;
189         lvb->lvb_mtime = inode->i_mtime.tv_sec;
190         lvb->lvb_atime = inode->i_atime.tv_sec;
191         lvb->lvb_ctime = inode->i_ctime.tv_sec;
192
193         /*
194          * LU-417: Add dirty pages block count lest i_blocks reports 0, some
195          * "cp" or "tar" on remote node may think it's a completely sparse file
196          * and skip it.
197          */
198         if (lvb->lvb_size > 0 && lvb->lvb_blocks == 0)
199                 lvb->lvb_blocks = dirty_cnt(inode);
200
201         RETURN(0);
202 }
203
204 static void vvp_req_attr_set(const struct lu_env *env, struct cl_object *obj,
205                              struct cl_req_attr *attr)
206 {
207         struct inode *inode;
208         struct obdo  *oa;
209         struct ll_inode_info *lli;
210         u64 valid_flags = OBD_MD_FLTYPE | OBD_MD_FLUID | OBD_MD_FLGID |
211                           OBD_MD_FLPROJID;
212
213         oa = attr->cra_oa;
214         inode = vvp_object_inode(obj);
215         lli = ll_i2info(inode);
216
217         if (attr->cra_type == CRT_WRITE) {
218                 valid_flags |= OBD_MD_FLMTIME | OBD_MD_FLCTIME;
219                 obdo_set_o_projid(oa, ll_i2info(inode)->lli_projid);
220         } else if (attr->cra_type == CRT_READ) {
221                 valid_flags |= OBD_MD_FLATIME;
222         }
223         obdo_from_inode(oa, inode, valid_flags & attr->cra_flags);
224         obdo_set_parent_fid(oa, &ll_i2info(inode)->lli_fid);
225         if (CFS_FAIL_CHECK(OBD_FAIL_LFSCK_INVALID_PFID))
226                 oa->o_parent_oid++;
227
228         attr->cra_uid = lli->lli_uid;
229         attr->cra_gid = lli->lli_gid;
230
231         memcpy(attr->cra_jobid, &lli->lli_jobid, sizeof(attr->cra_jobid));
232 }
233
234 static int vvp_inode_ops(const struct lu_env *env, struct cl_object *obj,
235                          enum coo_inode_opc opc, void *data)
236 {
237         struct inode *inode = vvp_object_inode(obj);
238         int rc = 0;
239
240         ENTRY;
241         switch (opc) {
242         case COIO_INODE_LOCK:
243                 if (ll_get_inode_lock_owner(inode) != current)
244                         ll_inode_lock(inode);
245                 else
246                         rc = -EALREADY;
247                 break;
248         case COIO_INODE_UNLOCK:
249                 if (ll_get_inode_lock_owner(inode) == current)
250                         ll_inode_unlock(inode);
251                 else
252                         rc = -ENOLCK;
253                 break;
254         case COIO_SIZE_LOCK:
255                 if (ll_i2info(inode)->lli_size_lock_owner != current)
256                         ll_inode_size_lock(inode);
257                 else
258                         rc = -EALREADY;
259                 break;
260         case COIO_SIZE_UNLOCK:
261                 if (ll_i2info(inode)->lli_size_lock_owner == current)
262                         ll_inode_size_unlock(inode);
263                 else
264                         rc = -ENOLCK;
265                 break;
266         default:
267                 rc = -EINVAL;
268                 break;
269         }
270
271         RETURN(rc);
272 }
273
274 static const struct cl_object_operations vvp_ops = {
275         .coo_page_init    = vvp_page_init,
276         .coo_io_init      = vvp_io_init,
277         .coo_attr_get     = vvp_attr_get,
278         .coo_attr_update  = vvp_attr_update,
279         .coo_conf_set     = vvp_conf_set,
280         .coo_prune        = vvp_prune,
281         .coo_glimpse      = vvp_object_glimpse,
282         .coo_req_attr_set = vvp_req_attr_set,
283         .coo_inode_ops    = vvp_inode_ops,
284 };
285
286 static int vvp_object_init0(const struct lu_env *env,
287                             struct vvp_object *vob,
288                             const struct cl_object_conf *conf)
289 {
290         vob->vob_inode = conf->coc_inode;
291         cl_object_page_init(&vob->vob_cl, sizeof(struct cl_page_slice));
292         return 0;
293 }
294
295 static int vvp_object_init(const struct lu_env *env, struct lu_object *obj,
296                            const struct lu_object_conf *conf)
297 {
298         struct vvp_device *dev = lu2vvp_dev(obj->lo_dev);
299         struct vvp_object *vob = lu2vvp(obj);
300         struct lu_object  *below;
301         struct lu_device  *under;
302         int result;
303
304         under = &dev->vdv_next->cd_lu_dev;
305         below = under->ld_ops->ldo_object_alloc(env, obj->lo_header, under);
306         if (below != NULL) {
307                 const struct cl_object_conf *cconf;
308
309                 cconf = lu2cl_conf(conf);
310                 lu_object_add(obj, below);
311                 result = vvp_object_init0(env, vob, cconf);
312         } else
313                 result = -ENOMEM;
314
315         return result;
316 }
317
318 static void vvp_object_free_rcu(struct rcu_head *head)
319 {
320         struct vvp_object *vob = container_of(head, struct vvp_object,
321                                               vob_header.coh_lu.loh_rcu);
322
323         kmem_cache_free(vvp_object_kmem, vob);
324 }
325
326 static void vvp_object_free(const struct lu_env *env, struct lu_object *obj)
327 {
328         struct vvp_object *vob = lu2vvp(obj);
329
330         lu_object_fini(obj);
331         lu_object_header_fini(obj->lo_header);
332         OBD_FREE_PRE(vob, sizeof(*vob), "slab-freed");
333         call_rcu(&vob->vob_header.coh_lu.loh_rcu, vvp_object_free_rcu);
334 }
335
336 static const struct lu_object_operations vvp_lu_obj_ops = {
337         .loo_object_init        = vvp_object_init,
338         .loo_object_free        = vvp_object_free,
339         .loo_object_print       = vvp_object_print,
340 };
341
342 struct vvp_object *cl_inode2vvp(struct inode *inode)
343 {
344         struct ll_inode_info *lli = ll_i2info(inode);
345         struct cl_object     *obj = lli->lli_clob;
346         struct lu_object     *lu;
347
348         LASSERT(obj != NULL);
349         lu = lu_object_locate(obj->co_lu.lo_header, &vvp_device_type);
350         LASSERT(lu != NULL);
351
352         return lu2vvp(lu);
353 }
354
355 struct lu_object *vvp_object_alloc(const struct lu_env *env,
356                                    const struct lu_object_header *unused,
357                                    struct lu_device *dev)
358 {
359         struct vvp_object *vob;
360         struct lu_object  *obj;
361
362         OBD_SLAB_ALLOC_PTR_GFP(vob, vvp_object_kmem, GFP_NOFS);
363         if (vob != NULL) {
364                 struct cl_object_header *hdr;
365
366                 obj = &vob->vob_cl.co_lu;
367                 hdr = &vob->vob_header;
368                 cl_object_header_init(hdr);
369                 hdr->coh_page_bufsize = round_up(sizeof(struct cl_page), 8);
370
371                 lu_object_init(obj, &hdr->coh_lu, dev);
372                 lu_object_add_top(&hdr->coh_lu, obj);
373
374                 vob->vob_cl.co_ops = &vvp_ops;
375                 obj->lo_ops = &vvp_lu_obj_ops;
376         } else
377                 obj = NULL;
378         return obj;
379 }