Whamcloud - gitweb
LU-417 llite: report non-zero blocks on writing client
[fs/lustre-release.git] / lustre / lclient / glimpse.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright (c) 2008, 2010, Oracle and/or its affiliates. All rights reserved.
30  * Use is subject to license terms.
31  *
32  * Copyright (c) 2011 Whamcloud, Inc.
33  *
34  */
35 /*
36  * This file is part of Lustre, http://www.lustre.org/
37  * Lustre is a trademark of Sun Microsystems, Inc.
38  *
39  * glimpse code shared between vvp and liblustre (and other Lustre clients in
40  * the future).
41  *
42  *   Author: Nikita Danilov <nikita.danilov@sun.com>
43  *   Author: Oleg Drokin <oleg.drokin@sun.com>
44  */
45
46 #include <libcfs/libcfs.h>
47 #include <obd_class.h>
48 #include <obd_support.h>
49 #include <obd.h>
50
51 #ifdef __KERNEL__
52 # include <lustre_dlm.h>
53 # include <lustre_lite.h>
54 # include <lustre_mdc.h>
55 # include <linux/pagemap.h>
56 # include <linux/file.h>
57 #else
58 #include <stdlib.h>
59 #include <string.h>
60 #include <assert.h>
61 #include <time.h>
62 #include <sys/types.h>
63 #include <sys/stat.h>
64 #include <sys/queue.h>
65 #include <fcntl.h>
66 #include <liblustre.h>
67 #endif
68
69 #include "cl_object.h"
70 #include "lclient.h"
71 #ifdef __KERNEL__
72 # include "../llite/llite_internal.h"
73 #else
74 # include "../liblustre/llite_lib.h"
75 #endif
76
77 static const struct cl_lock_descr whole_file = {
78         .cld_start = 0,
79         .cld_end   = CL_PAGE_EOF,
80         .cld_mode  = CLM_READ
81 };
82
83 /*
84  * Check whether file has possible unwriten pages.
85  *
86  * \retval 1    file is mmap-ed or has dirty pages
87  *         0    otherwise
88  */
89 blkcnt_t dirty_cnt(struct inode *inode)
90 {
91         blkcnt_t cnt = 0;
92 #ifdef __KERNEL__
93         struct ccc_object *vob = cl_inode2ccc(inode);
94         void              *results[1];
95
96         if (inode->i_mapping != NULL)
97                 cnt += radix_tree_gang_lookup_tag(&inode->i_mapping->page_tree,
98                                                   results, 0, 1,
99                                                   PAGECACHE_TAG_DIRTY);
100         if (cnt == 0 && cfs_atomic_read(&vob->cob_mmap_cnt) > 0)
101                 cnt = 1;
102
103 #endif
104         return (cnt > 0) ? 1 : 0;
105 }
106
107 int cl_glimpse_lock(const struct lu_env *env, struct cl_io *io,
108                     struct inode *inode, struct cl_object *clob)
109 {
110         struct cl_lock_descr *descr = &ccc_env_info(env)->cti_descr;
111         struct cl_inode_info *lli   = cl_i2info(inode);
112         const struct lu_fid  *fid   = lu_object_fid(&clob->co_lu);
113         struct ccc_io        *cio   = ccc_env_io(env);
114         struct cl_lock       *lock;
115         int result;
116
117         ENTRY;
118         result = 0;
119         if (!(lli->lli_flags & LLIF_MDS_SIZE_LOCK)) {
120                 CDEBUG(D_DLMTRACE, "Glimpsing inode "DFID"\n", PFID(fid));
121                 if (lli->lli_smd) {
122                         /* NOTE: this looks like DLM lock request, but it may
123                          *       not be one. Due to CEF_ASYNC flag (translated
124                          *       to LDLM_FL_HAS_INTENT by osc), this is
125                          *       glimpse request, that won't revoke any
126                          *       conflicting DLM locks held. Instead,
127                          *       ll_glimpse_callback() will be called on each
128                          *       client holding a DLM lock against this file,
129                          *       and resulting size will be returned for each
130                          *       stripe. DLM lock on [0, EOF] is acquired only
131                          *       if there were no conflicting locks. If there
132                          *       were conflicting locks, enqueuing or waiting
133                          *       fails with -ENAVAIL, but valid inode
134                          *       attributes are returned anyway. */
135                         *descr = whole_file;
136                         descr->cld_obj   = clob;
137                         descr->cld_mode  = CLM_PHANTOM;
138                         descr->cld_enq_flags = CEF_ASYNC | CEF_MUST;
139                         cio->cui_glimpse = 1;
140                         /*
141                          * CEF_ASYNC is used because glimpse sub-locks cannot
142                          * deadlock (because they never conflict with other
143                          * locks) and, hence, can be enqueued out-of-order.
144                          *
145                          * CEF_MUST protects glimpse lock from conversion into
146                          * a lockless mode.
147                          */
148                         lock = cl_lock_request(env, io, descr, "glimpse",
149                                                cfs_current());
150                         cio->cui_glimpse = 0;
151
152                         if (IS_ERR(lock))
153                                 RETURN(PTR_ERR(lock));
154
155                         result = cl_wait(env, lock);
156                         if (result == 0) {
157                                 cl_merge_lvb(inode);
158                                 if (cl_isize_read(inode) > 0 &&
159                                     inode->i_blocks == 0) {
160                                         /*
161                                          * LU-417: Add dirty pages block count
162                                          * lest i_blocks reports 0, some "cp" or
163                                          * "tar" may think it's a completely
164                                          * sparse file and skip it.
165                                          */
166                                         inode->i_blocks = dirty_cnt(inode);
167                                 }
168                                 cl_unuse(env, lock);
169                         }
170                         cl_lock_release(env, lock, "glimpse", cfs_current());
171                 } else {
172                         CDEBUG(D_DLMTRACE, "No objects for inode\n");
173                 }
174         }
175
176         RETURN(result);
177 }
178
179 static int cl_io_get(struct inode *inode, struct lu_env **envout,
180                      struct cl_io **ioout, int *refcheck)
181 {
182         struct lu_env          *env;
183         struct cl_io           *io;
184         struct cl_inode_info   *lli = cl_i2info(inode);
185         struct cl_object       *clob = lli->lli_clob;
186         int result;
187
188         if (S_ISREG(cl_inode_mode(inode))) {
189                 env = cl_env_get(refcheck);
190                 if (!IS_ERR(env)) {
191                         io = ccc_env_thread_io(env);
192                         io->ci_obj = clob;
193                         *envout = env;
194                         *ioout  = io;
195                         result = +1;
196                 } else
197                         result = PTR_ERR(env);
198         } else
199                 result = 0;
200         return result;
201 }
202
203 int cl_glimpse_size(struct inode *inode)
204 {
205         /*
206          * We don't need ast_flags argument to cl_glimpse_size(), because
207          * osc_lock_enqueue() takes care of the possible deadlock that said
208          * argument was introduced to avoid.
209          */
210         /*
211          * XXX but note that ll_file_seek() passes LDLM_FL_BLOCK_NOWAIT to
212          * cl_glimpse_size(), which doesn't make sense: glimpse locks are not
213          * blocking anyway.
214          */
215         struct lu_env          *env = NULL;
216         struct cl_io           *io  = NULL;
217         int                     result;
218         int                     refcheck;
219
220         ENTRY;
221
222         result = cl_io_get(inode, &env, &io, &refcheck);
223         if (result > 0) {
224                 result = cl_io_init(env, io, CIT_MISC, io->ci_obj);
225                 if (result > 0)
226                         /*
227                          * nothing to do for this io. This currently happens
228                          * when stripe sub-object's are not yet created.
229                          */
230                         result = io->ci_result;
231                 else if (result == 0)
232                         result = cl_glimpse_lock(env, io, inode, io->ci_obj);
233                 cl_io_fini(env, io);
234                 cl_env_put(env, &refcheck);
235         }
236         RETURN(result);
237 }
238
239 int cl_local_size(struct inode *inode)
240 {
241         struct lu_env           *env = NULL;
242         struct cl_io            *io  = NULL;
243         struct ccc_thread_info  *cti;
244         struct cl_object        *clob;
245         struct cl_lock_descr    *descr;
246         struct cl_lock          *lock;
247         int                      result;
248         int                      refcheck;
249
250         ENTRY;
251
252         if (!cl_i2info(inode)->lli_smd)
253                 RETURN(0);
254
255         result = cl_io_get(inode, &env, &io, &refcheck);
256         if (result <= 0)
257                 RETURN(result);
258
259         clob = io->ci_obj;
260         result = cl_io_init(env, io, CIT_MISC, clob);
261         if (result > 0)
262                 result = io->ci_result;
263         else if (result == 0) {
264                 cti = ccc_env_info(env);
265                 descr = &cti->cti_descr;
266
267                 *descr = whole_file;
268                 descr->cld_obj = clob;
269                 lock = cl_lock_peek(env, io, descr, "localsize", cfs_current());
270                 if (lock != NULL) {
271                         cl_merge_lvb(inode);
272                         cl_unuse(env, lock);
273                         cl_lock_release(env, lock, "localsize", cfs_current());
274                         result = 0;
275                 } else
276                         result = -ENODATA;
277         }
278         cl_io_fini(env, io);
279         cl_env_put(env, &refcheck);
280         RETURN(result);
281 }
282